Saltar al contenido principal
POST
/
v3
/
async
/
wan2.7-i2v
Wanxiang Wan 2.7 de imagen a video
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "prompt": "<string>",
  "duration": 123,
  "image_url": "<string>",
  "watermark": true,
  "resolution": "<string>",
  "prompt_extend": true,
  "first_clip_url": "<string>",
  "last_frame_url": "<string>",
  "negative_prompt": "<string>",
  "driving_audio_url": "<string>"
}
'
{
  "task_id": "<string>"
}
Modelo de imagen a video Wanxiang Wan 2.7, compatible con entradas multimodales (texto/imagen/audio/video), capaz de realizar tres tareas principales: generación de video a partir del primer fotograma, generación de video a partir del primer y último fotograma, y continuación de video. Admite resoluciones 720P y 1080P, duraciones de 2 a 15 segundos, con facturación por segundo. La salida incluye audio de forma predeterminada.
Esta es una API asíncrona y solo devolverá el task_id de la tarea asíncrona. Debe usar este task_id para solicitar la API de consulta del resultado de la tarea y recuperar el resultado generado.

Encabezados de solicitud

Content-Type
string
requerido
Valores enumerados: application/json
Authorization
string
requerido
Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

seed
integer
Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]
prompt
string
Prompt de texto, utilizado para describir los elementos y las características visuales que se espera incluir en el video generado. Admite chino e inglés, hasta 5000 caracteres.Límite de longitud: 0 - 5000
duration
integer
predeterminado:5
Duración del video generado, en segundos, con facturación por segundo. Entero en el rango [2, 15].Rango de valores: [2, 15]
image_url
string
requerido
URL de la imagen del primer fotograma. Formatos compatibles: JPEG, JPG, PNG (no admite canal transparente), BMP, WEBP. El rango de ancho y alto de la resolución es de [240, 8000] píxeles, relación de aspecto de 1:8 a 8:1, tamaño de archivo no superior a 20 MB. Debe elegirse entre este parámetro y first_clip_url; se debe proporcionar al menos uno.
watermark
boolean
predeterminado:false
Indica si se agrega una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.
resolution
string
predeterminado:"1080P"
Nivel de resolución del video de salida, afecta el costo. La relación de aspecto del video se mantiene coherente con el material de entrada.Valores opcionales: 720P, 1080P
prompt_extend
boolean
predeterminado:true
Indica si se habilita la reescritura inteligente del prompt. Al habilitarla, se utiliza un modelo grande para reescribir inteligentemente el prompt de entrada; mejora notablemente el resultado de generación para prompts más cortos, pero aumenta el tiempo de procesamiento.
first_clip_url
string
URL del primer fragmento de video, utilizada para la continuación de video. El modelo generará la continuación basándose en el contenido de este video. Formatos compatibles: mp4, mov; duración de 2 a 10 segundos; rango de ancho y alto de la resolución [240, 4096] píxeles; relación de aspecto de 1:8 a 8:1; tamaño de archivo no superior a 100 MB. Debe elegirse entre este parámetro e image_url.
last_frame_url
string
URL de la imagen del último fotograma. En combinación con el primer fotograma, permite generar un video a partir del primer y último fotograma. Las restricciones de formato son las mismas que para el primer fotograma.
negative_prompt
string
Prompt negativo, utilizado para describir el contenido que no se desea ver en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500
driving_audio_url
string
URL del audio de conducción. Al proporcionarla, el modelo generará el video usando este audio como fuente de conducción (por ejemplo, sincronización labial, acciones sincronizadas con puntos del audio, etc.). Si no se proporciona, el modelo generará automáticamente música de fondo o efectos de sonido compatibles. Formatos compatibles: wav, mp3; duración de 2 a 30 segundos; tamaño de archivo no superior a 15 MB.

Información de respuesta

task_id
string
Use task_id para solicitar la API de consulta del resultado de la tarea y recuperar la salida generada.