Wanxiang Wan 2.7 video a partir de referencia

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-r2v

Wanxiang Wan 2.7 video a partir de referencia

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

Modelo Wanxiang Wan 2.7 para crear video a partir de referencias, compatible con entradas multimodales (texto/imagen/video). Permite usar personas u objetos como protagonistas para generar videos de actuación de un solo personaje o de interacción entre varios personajes. Admite storyboard inteligente para generar videos con múltiples planos. Compatible con resoluciones 720P y 1080P, duración de 2 a 10 segundos y facturación por segundo. La salida incluye audio de forma predeterminada.

Esta es una API asíncrona y solo devolverá el task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta de resultados de tarea y recuperar el resultado generado.

Encabezados de solicitud

Content-Type

string

requerido

Valores enumerados: application/json

Authorization

string

requerido

Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

seed

integer

Semilla de número aleatorio, utilizada para mejorar la reproducibilidad de los resultados generados. Rango de valores [0, 2147483647].Rango de valores: [0, 2147483647]

size

string

predeterminado:"1920*1080"

Resolución del video de salida (anchoalto), afecta el coste. Nivel 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Nivel 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valores opcionales: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632

audio

boolean

predeterminado:true

Indica si se debe generar un video con sonido; afecta el coste. El valor predeterminado es true (video con sonido).

media

array

requerido

Array de medios de referencia, utilizado para extraer la apariencia del personaje, los movimientos y el timbre de voz. Según el orden del array, corresponde a character1, character2, etc. en el prompt. Número de imágenes: 0~~5; número de videos: 0~~3; el total no debe superar 5. Formatos de imagen: JPEG, JPG, PNG, BMP, WEBP; resolución [240,8000] píxeles; no más de 10 MB. Formatos de video: MP4, MOV; duración de 1~~30 segundos; no más de 100 MB. Formatos de audio: MP3, WAV, FLAC; duración de 3~~30 segundos.Longitud del array: 1 - 5

Ocultar propiedades

url

string

requerido

URL del archivo multimedia.

type

string

requerido

Tipo de medio. reference_image: imagen de referencia, utilizada para extraer la apariencia del personaje; reference_video: video de referencia, utilizado para extraer los movimientos y la apariencia del personaje; first_frame: imagen del primer fotograma, controla la imagen inicial del video.Valores opcionales: reference_image, reference_video, first_frame

reference_voice

string

URL del audio de referencia del personaje, utilizada para clonar el timbre de voz del personaje y generar un video con sonido. Formatos: MP3, WAV, FLAC; duración de 3~30 segundos.

prompt

string

requerido

Prompt de texto, utilizado para describir los elementos y características visuales que se espera incluir en el video generado. Use identificadores como character1, character2, etc. para hacer referencia a los personajes de referencia; cada referencia (video o imagen) contiene un único personaje. Admite chino e inglés, hasta 1500 caracteres.Límite de longitud: 0 - 1500

duration

integer

predeterminado:5

Duración del video generado, en segundos; se factura por segundo. Entero en el rango [2, 10].Rango de valores: [2, 10]

shot_type

string

predeterminado:"single"

Tipo de plano. single es un solo plano (predeterminado), multi es múltiples planos. Este parámetro tiene mayor prioridad que el prompt.Valores opcionales: single, multi

watermark

boolean

predeterminado:false

Indica si se debe añadir una marca de agua; la marca de agua se ubica en la esquina inferior derecha del video.

negative_prompt

string

Prompt negativo, utilizado para describir el contenido que no se desea que aparezca en las imágenes del video. Admite chino e inglés, hasta 500 caracteres.Límite de longitud: 0 - 500

Información de respuesta

task_id

string

Use task_id para solicitar la API de consulta de resultados de tarea y recuperar la salida generada.

Wanxiang Wan 2.7 texto a video

Edición de video Wan 2.7 de Wanxiang

​Encabezados de solicitud

​Cuerpo de la solicitud

​Información de respuesta

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta