Wanxiang Wan 2.7 de imagen a video

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "prompt": "<string>",
  "duration": 123,
  "image_url": "<string>",
  "watermark": true,
  "resolution": "<string>",
  "prompt_extend": true,
  "first_clip_url": "<string>",
  "last_frame_url": "<string>",
  "negative_prompt": "<string>",
  "driving_audio_url": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-i2v

Wanxiang Wan 2.7 de imagen a video

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "prompt": "<string>",
  "duration": 123,
  "image_url": "<string>",
  "watermark": true,
  "resolution": "<string>",
  "prompt_extend": true,
  "first_clip_url": "<string>",
  "last_frame_url": "<string>",
  "negative_prompt": "<string>",
  "driving_audio_url": "<string>"
}
'

{
  "task_id": "<string>"
}

Modelo de imagen a video Wanxiang Wan 2.7, compatible con entradas multimodales (texto/imagen/audio/video), capaz de realizar tres tareas principales: generación de video a partir del primer fotograma, generación de video a partir del primer y último fotograma, y continuación de video. Admite resoluciones 720P y 1080P, duraciones de 2 a 15 segundos, con facturación por segundo. La salida incluye audio de forma predeterminada.

Esta es una API asíncrona y solo devolverá el task_id de la tarea asíncrona. Debe usar este task_id para solicitar la API de consulta del resultado de la tarea y recuperar el resultado generado.

Encabezados de solicitud

Content-Type

string

requerido

Valores enumerados: application/json

Authorization

string

requerido

Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

seed

integer

Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]

prompt

string

Prompt de texto, utilizado para describir los elementos y las características visuales que se espera incluir en el video generado. Admite chino e inglés, hasta 5000 caracteres.Límite de longitud: 0 - 5000

duration

integer

predeterminado:5

Duración del video generado, en segundos, con facturación por segundo. Entero en el rango [2, 15].Rango de valores: [2, 15]

image_url

string

requerido

URL de la imagen del primer fotograma. Formatos compatibles: JPEG, JPG, PNG (no admite canal transparente), BMP, WEBP. El rango de ancho y alto de la resolución es de [240, 8000] píxeles, relación de aspecto de 1:8 a 8:1, tamaño de archivo no superior a 20 MB. Debe elegirse entre este parámetro y first_clip_url; se debe proporcionar al menos uno.

watermark

boolean

predeterminado:false

Indica si se agrega una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.

resolution

string

predeterminado:"1080P"

Nivel de resolución del video de salida, afecta el costo. La relación de aspecto del video se mantiene coherente con el material de entrada.Valores opcionales: 720P, 1080P

prompt_extend

boolean

predeterminado:true

Indica si se habilita la reescritura inteligente del prompt. Al habilitarla, se utiliza un modelo grande para reescribir inteligentemente el prompt de entrada; mejora notablemente el resultado de generación para prompts más cortos, pero aumenta el tiempo de procesamiento.

first_clip_url

string

URL del primer fragmento de video, utilizada para la continuación de video. El modelo generará la continuación basándose en el contenido de este video. Formatos compatibles: mp4, mov; duración de 2 a 10 segundos; rango de ancho y alto de la resolución [240, 4096] píxeles; relación de aspecto de 1:8 a 8:1; tamaño de archivo no superior a 100 MB. Debe elegirse entre este parámetro e image_url.

last_frame_url

string

URL de la imagen del último fotograma. En combinación con el primer fotograma, permite generar un video a partir del primer y último fotograma. Las restricciones de formato son las mismas que para el primer fotograma.

negative_prompt

string

Prompt negativo, utilizado para describir el contenido que no se desea ver en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500

driving_audio_url

string

URL del audio de conducción. Al proporcionarla, el modelo generará el video usando este audio como fuente de conducción (por ejemplo, sincronización labial, acciones sincronizadas con puntos del audio, etc.). Si no se proporciona, el modelo generará automáticamente música de fondo o efectos de sonido compatibles. Formatos compatibles: wav, mp3; duración de 2 a 30 segundos; tamaño de archivo no superior a 15 MB.

Información de respuesta

task_id

string

Use task_id para solicitar la API de consulta del resultado de la tarea y recuperar la salida generada.

PixVerse C1 de fotograma inicial y final a video

Wanxiang Wan 2.7 texto a video

​Encabezados de solicitud

​Cuerpo de la solicitud

​Información de respuesta

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta