Saltar al contenido principal
POST
/
v3
/
async
/
wan2.7-r2v
Wanxiang Wan 2.7 video a partir de referencia
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'
{
  "task_id": "<string>"
}
Modelo Wanxiang Wan 2.7 para crear video a partir de referencias, compatible con entradas multimodales (texto/imagen/video). Permite usar personas u objetos como protagonistas para generar videos de actuación de un solo personaje o de interacción entre varios personajes. Admite storyboard inteligente para generar videos con múltiples planos. Compatible con resoluciones 720P y 1080P, duración de 2 a 10 segundos y facturación por segundo. La salida incluye audio de forma predeterminada.
Esta es una API asíncrona y solo devolverá el task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta de resultados de tarea y recuperar el resultado generado.

Encabezados de solicitud

Content-Type
string
requerido
Valores enumerados: application/json
Authorization
string
requerido
Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

seed
integer
Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]
size
string
predeterminado:"1920*1080"
Resolución del video de salida (anchoalto), afecta el coste. Nivel 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Nivel 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valores opcionales: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
audio
boolean
predeterminado:true
Indica si se debe generar un video con sonido; afecta el coste. El valor predeterminado es true (video con sonido).
media
array
requerido
Array de medios de referencia, utilizado para extraer la apariencia del personaje, los movimientos y el timbre de voz. Según el orden del array, corresponde a character1, character2, etc. en el prompt. Número de imágenes: 05; número de videos: 03; el total no debe superar 5. Formatos de imagen: JPEG, JPG, PNG, BMP, WEBP; resolución [240,8000] píxeles; no más de 10 MB. Formatos de video: MP4, MOV; duración de 130 segundos; no más de 100 MB. Formatos de audio: MP3, WAV, FLAC; duración de 330 segundos.Longitud del array: 1 - 5
prompt
string
requerido
Prompt de texto, utilizado para describir los elementos y características visuales que se espera incluir en el video generado. Use identificadores como character1, character2, etc. para hacer referencia a los personajes de referencia; cada referencia (video o imagen) contiene un único personaje. Admite chino e inglés, hasta 1500 caracteres.Límite de longitud: 0 - 1500
duration
integer
predeterminado:5
Duración del video generado, en segundos; se factura por segundo. Entero en el rango [2, 10].Rango de valores: [2, 10]
shot_type
string
predeterminado:"single"
Tipo de plano. single es un solo plano (predeterminado), multi es múltiples planos. Este parámetro tiene mayor prioridad que el prompt.Valores opcionales: single, multi
watermark
boolean
predeterminado:false
Indica si se debe añadir una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.
negative_prompt
string
Prompt negativo, utilizado para describir el contenido que no se desea que aparezca en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500

Información de respuesta

task_id
string
Use task_id para solicitar la API de consulta de resultados de tarea y recuperar la salida generada.