Saltar al contenido principal
POST
/
v3
/
async
/
wan-i2v
Wan 2.1 de imagen a vídeo
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "prompt": "<string>",
  "image_url": "<string>",
  "negative_prompt": "<string>",
  "width": 123,
  "height": 123,
  "loras": [
    {
      "path": "<string>",
      "scale": 123
    }
  ],
  "seed": 123,
  "steps": 123,
  "guidance_scale": 123,
  "flow_shift": 123,
  "enable_safety_checker": true,
  "fast_mode": true
}
'
{
  "task_id": "<string>"
}
Inferencia acelerada del modelo Wan 2.1 14B de imagen a vídeo. Se trata de un conjunto completo y abierto de modelos base de vídeo que amplía los límites de la generación de vídeo. De forma predeterminada, la API generará un vídeo de 5 segundos.
Esta es una API asíncrona y solo devolverá el task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta del resultado de la tarea y recuperar el resultado de la generación de vídeo.

Encabezados de solicitud

Content-Type
string
requerido
Valores enumerados: application/json
Authorization
string
requerido
Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

prompt
string
requerido
Texto de prompt que guía la generación deseada.Rango de valores: [1, 2000].
image_url
string
requerido
URL de la imagen que se usará para la generación de vídeo.
negative_prompt
string
El prompt negativo indica al modelo qué elementos debe evitar generar.Rango de valores: [0, 2000].
width
integer
Ancho del vídeo de salida.Valores enumerados: 480, 720, 832, 1280.Valor predeterminado: 832. Si no se especifica el ancho o la altura, el ancho y la altura se forzarán a 832 y 480.
height
integer
Altura del vídeo de salida.Compatible con:
  • (480p) Cuando el ancho es 480, la altura se establece en 832
  • (480p) Cuando el ancho es 832, la altura se establece en 480
  • (720p) Cuando el ancho es 720, la altura se establece en 1280
  • (720p) Cuando el ancho es 1280, la altura se establece en 720
Valor predeterminado: 480. Si no se especifica el ancho o la altura, el ancho y la altura se forzarán a 832 y 480.
El vídeo de salida mantendrá la relación de aspecto de la imagen de entrada; la configuración de width x height solo determina la nitidez del vídeo de salida. Por ejemplo, un vídeo 720p será más nítido que un vídeo 480p.
loras
object[]
Modelos LoRA aplicados a la generación de vídeo.Se admite especificar hasta 3 modelos LoRA.
seed
integer
Semilla de número aleatorio, el número que genera el ruido en Stable Diffusion, rango de valores: [-1, 9999999999]. El valor predeterminado es -1.
steps
integer
Número de pasos de iteración, es decir, el número de iteraciones del proceso de creación de la imagen, rango de valores: [1, 40]. Valor predeterminado: 30.
guidance_scale
float
El parámetro de escala de guía controla en qué medida el contenido generado sigue el prompt. Rango de valores: [0, 10]. Valor predeterminado: 5.0.
flow_shift
float
El parámetro flow_shift afecta principalmente a la velocidad y la amplitud del movimiento de los objetos en el vídeo. Los valores más altos producen movimientos más evidentes y rápidos, mientras que los valores más bajos hacen que el movimiento sea más lento y sutil.Rango de valores: [1, 10]. Valor predeterminado: 5.0.
enable_safety_checker
boolean
El parámetro enable_safety_checker controla si se aplica un filtro de seguridad al contenido generado. Cuando está habilitado, ayuda a filtrar contenido potencialmente dañino o inapropiado de la salida de vídeo.Valor predeterminado: true.
fast_mode
boolean
Indica si se habilita el modo rápido, que generará el vídeo más rápido, pero puede reducir la calidad y el precio.Valor predeterminado: false.

Información de respuesta

task_id
string
requerido
El task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta del resultado de la tarea y obtener el resultado generado