Wanxiang Wan 2.7 texto a video - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/async/wan2.7-t2v \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "seed": 123, "size": "<string>", "prompt": "<string>", "duration": 123, "audio_url": "<string>", "watermark": true, "prompt_extend": true, "negative_prompt": "<string>" } '

Modelo de texto a video Wanxiang Wan 2.7, genera videos fluidos a partir de prompts de texto. Admite audio como guía o doblaje automático, resoluciones 720P y 1080P, duración de 2 a 15 segundos y facturación por segundo. La salida incluye audio de forma predeterminada.

Esta es una API asíncrona que solo devolverá el task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta de resultados de tareas y recuperar el resultado generado.

Encabezados de solicitud

Content-Type

string

requerido

Valores enumerados: application/json

Authorization

string

requerido

Formato de autenticación Bearer: Bearer {{clave de API}}.

Cuerpo de la solicitud

seed

integer

Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]

size

string

predeterminado:"1920*1080"

Resolución del video de salida (anchoalto), afecta al coste. Nivel 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Nivel 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valores opcionales: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632

prompt

string

requerido

Prompt de texto utilizado para describir los elementos y características visuales que se espera incluir en el video generado. Admite chino e inglés, hasta 1500 caracteres; el contenido que exceda este límite se truncará automáticamente.Límite de longitud: 0 - 1500

duration

integer

predeterminado:5

Duración del video generado, en segundos, facturada por segundo. Entero en el rango [2, 15].Rango de valores: [2, 15]

audio_url

string

URL del archivo de audio; el modelo usará este audio para guiar la generación del video (por ejemplo, sincronización labial, sincronización de acciones con puntos clave, etc.). Si no se proporciona, el modelo generará automáticamente música de fondo o efectos de sonido compatibles. Admite formatos wav y mp3, duración de 3 a 30 segundos y archivo de hasta 15 MB. Si el audio supera la duración del video, se recortará; si es insuficiente, la parte excedente quedará en silencio.

watermark

boolean

predeterminado:false

Si se debe añadir una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.

prompt_extend

boolean

predeterminado:true

Si se debe habilitar la reescritura inteligente de prompt. Al habilitarla, se usa un modelo grande para reescribir de forma inteligente el prompt de entrada; mejora notablemente los resultados con prompts más cortos, pero aumenta el tiempo de procesamiento.

negative_prompt

string

Prompt negativo, utilizado para describir el contenido que no se desea que aparezca en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500

Información de respuesta

task_id

string

Use task_id para solicitar la API de consulta de resultados de tareas y recuperar la salida generada.

​Encabezados de solicitud

​Cuerpo de la solicitud

​Información de respuesta

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta