Saltar al contenido principal
POST
/
v3
/
async
/
wan2.7-t2v
Wanxiang Wan 2.7 texto a video
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-t2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "audio_url": "<string>",
  "watermark": true,
  "prompt_extend": true,
  "negative_prompt": "<string>"
}
'
{
  "task_id": "<string>"
}
Modelo de texto a video Wanxiang Wan 2.7, genera videos fluidos a partir de prompts de texto. Admite audio como guía o doblaje automático, resoluciones 720P y 1080P, duración de 2 a 15 segundos y facturación por segundo. La salida incluye audio de forma predeterminada.
Esta es una API asíncrona que solo devolverá el task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta de resultados de tareas y recuperar el resultado generado.

Encabezados de solicitud

Content-Type
string
requerido
Valores enumerados: application/json
Authorization
string
requerido
Formato de autenticación Bearer: Bearer {{clave de API}}.

Cuerpo de la solicitud

seed
integer
Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]
size
string
predeterminado:"1920*1080"
Resolución del video de salida (anchoalto), afecta al coste. Nivel 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Nivel 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valores opcionales: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
prompt
string
requerido
Prompt de texto utilizado para describir los elementos y características visuales que se espera incluir en el video generado. Admite chino e inglés, hasta 1500 caracteres; el contenido que exceda este límite se truncará automáticamente.Límite de longitud: 0 - 1500
duration
integer
predeterminado:5
Duración del video generado, en segundos, facturada por segundo. Entero en el rango [2, 15].Rango de valores: [2, 15]
audio_url
string
URL del archivo de audio; el modelo usará este audio para guiar la generación del video (por ejemplo, sincronización labial, sincronización de acciones con puntos clave, etc.). Si no se proporciona, el modelo generará automáticamente música de fondo o efectos de sonido compatibles. Admite formatos wav y mp3, duración de 3 a 30 segundos y archivo de hasta 15 MB. Si el audio supera la duración del video, se recortará; si es insuficiente, la parte excedente quedará en silencio.
watermark
boolean
predeterminado:false
Si se debe añadir una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.
prompt_extend
boolean
predeterminado:true
Si se debe habilitar la reescritura inteligente de prompt. Al habilitarla, se usa un modelo grande para reescribir de forma inteligente el prompt de entrada; mejora notablemente los resultados con prompts más cortos, pero aumenta el tiempo de procesamiento.
negative_prompt
string
Prompt negativo, utilizado para describir el contenido que no se desea que aparezca en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500

Información de respuesta

task_id
string
Use task_id para solicitar la API de consulta de resultados de tareas y recuperar la salida generada.