Pular para o conteúdo principal
POST
/
v3
/
async
/
wan2.7-r2v
Wanxiang Wan 2.7 vídeo a partir de referência
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'
{
  "task_id": "<string>"
}
Modelo Wanxiang Wan 2.7 para gerar vídeo a partir de referência, com suporte a entradas multimodais (texto/imagem/vídeo). Ele pode usar uma pessoa ou objeto como protagonista para gerar vídeos de atuação de um único personagem ou de interação entre múltiplos personagens. Oferece suporte a storyboard inteligente para gerar vídeos com múltiplas tomadas. Suporta resoluções 720P e 1080P, duração de 2 a 10 segundos e cobrança por segundo. A saída inclui áudio por padrão.
Esta é uma API assíncrona e retornará apenas o task_id da tarefa assíncrona. Você deve usar esse task_id para solicitar a API de consulta de resultado da tarefa e recuperar o resultado gerado.

Cabeçalhos da solicitação

Content-Type
string
obrigatório
Valores enumerados: application/json
Authorization
string
obrigatório
Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da solicitação

seed
integer
Semente de número aleatório, usada para melhorar a reprodutibilidade dos resultados gerados. Intervalo de valores: [0, 2147483647].Intervalo de valores: [0, 2147483647]
size
string
padrão:"1920*1080"
Resolução do vídeo de saída (larguraaltura), afeta o custo. Faixa 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Faixa 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valores opcionais: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
audio
boolean
padrão:true
Se deve gerar vídeo com som; afeta o custo. O padrão é true (vídeo com som).
media
array
obrigatório
Array de mídias de referência, usado para extrair a aparência do personagem, ações e timbre de voz. Corresponde a character1, character2 etc. no prompt, de acordo com a ordem do array. Quantidade de imagens: 0 a 5; quantidade de vídeos: 0 a 3; total não deve exceder 5. Formatos de imagem: JPEG, JPG, PNG, BMP, WEBP; resolução de [240,8000] pixels; até 10 MB. Formatos de vídeo: MP4, MOV; duração de 1 a 30 segundos; até 100 MB. Formatos de áudio: MP3, WAV, FLAC; duração de 3 a 30 segundos.Comprimento do array: 1 - 5
prompt
string
obrigatório
Prompt de texto, usado para descrever os elementos e características visuais esperados no vídeo gerado. Use identificadores como character1, character2 etc. para referenciar personagens de referência; cada referência (vídeo ou imagem) deve conter apenas um único personagem. Suporta chinês e inglês, com no máximo 1500 caracteres.Limite de comprimento: 0 - 1500
duration
integer
padrão:5
Duração do vídeo gerado, em segundos, com cobrança por segundo. Um número inteiro no intervalo [2, 10].Intervalo de valores: [2, 10]
shot_type
string
padrão:"single"
Tipo de tomada. single é tomada única (padrão), multi é múltiplas tomadas. O parâmetro tem prioridade maior que o prompt.Valores opcionais: single, multi
watermark
boolean
padrão:false
Se deve adicionar uma marca d’água; a marca d’água fica no canto inferior direito do vídeo.
negative_prompt
string
Prompt negativo, usado para descrever conteúdos que você não deseja que apareçam nas imagens do vídeo. Suporta chinês e inglês, com no máximo 500 caracteres.Limite de comprimento: 0 - 500

Informações da resposta

task_id
string
Use o task_id para solicitar a API de consulta de resultado da tarefa e recuperar a saída gerada.