Wanxiang Wan 2.7 vídeo a partir de referência

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-r2v

Wanxiang Wan 2.7 vídeo a partir de referência

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

Modelo Wanxiang Wan 2.7 para gerar vídeo a partir de referência, com suporte a entradas multimodais (texto/imagem/vídeo). Ele pode usar uma pessoa ou objeto como protagonista para gerar vídeos de atuação de um único personagem ou de interação entre múltiplos personagens. Oferece suporte a storyboard inteligente para gerar vídeos com múltiplas tomadas. Suporta resoluções 720P e 1080P, duração de 2 a 10 segundos e cobrança por segundo. A saída inclui áudio por padrão.

Esta é uma API assíncrona e retornará apenas o task_id da tarefa assíncrona. Você deve usar esse task_id para solicitar a API de consulta de resultado da tarefa e recuperar o resultado gerado.

Cabeçalhos da solicitação

Content-Type

string

obrigatório

Valores enumerados: application/json

Authorization

string

obrigatório

Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da solicitação

seed

integer

Semente de número aleatório, usada para melhorar a reprodutibilidade dos resultados gerados. Intervalo de valores: [0, 2147483647].Intervalo de valores: [0, 2147483647]

size

string

padrão:"1920*1080"

Resolução do vídeo de saída (larguraaltura), afeta o custo. Faixa 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Faixa 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valores opcionais: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632

audio

boolean

padrão:true

Se deve gerar vídeo com som; afeta o custo. O padrão é true (vídeo com som).

media

array

obrigatório

Array de mídias de referência, usado para extrair a aparência do personagem, ações e timbre de voz. Corresponde a character1, character2 etc. no prompt, de acordo com a ordem do array. Quantidade de imagens: 0 a 5; quantidade de vídeos: 0 a 3; total não deve exceder 5. Formatos de imagem: JPEG, JPG, PNG, BMP, WEBP; resolução de [240,8000] pixels; até 10 MB. Formatos de vídeo: MP4, MOV; duração de 1 a 30 segundos; até 100 MB. Formatos de áudio: MP3, WAV, FLAC; duração de 3 a 30 segundos.Comprimento do array: 1 - 5

Ocultar properties

url

string

obrigatório

URL do arquivo de mídia.

type

string

obrigatório

Tipo de mídia. reference_image: imagem de referência, usada para extrair a aparência do personagem; reference_video: vídeo de referência, usado para extrair as ações e a aparência do personagem; first_frame: imagem do primeiro quadro, controla a imagem inicial do vídeo.Valores opcionais: reference_image, reference_video, first_frame

reference_voice

string

URL do áudio de referência do personagem, usado para clonar o timbre de voz do personagem e gerar vídeo com som. Formatos: MP3, WAV, FLAC; duração de 3 a 30 segundos.

prompt

string

obrigatório

Prompt de texto, usado para descrever os elementos e características visuais esperados no vídeo gerado. Use identificadores como character1, character2 etc. para referenciar personagens de referência; cada referência (vídeo ou imagem) deve conter apenas um único personagem. Suporta chinês e inglês, com no máximo 1500 caracteres.Limite de comprimento: 0 - 1500

duration

integer

padrão:5

Duração do vídeo gerado, em segundos, com cobrança por segundo. Um número inteiro no intervalo [2, 10].Intervalo de valores: [2, 10]

shot_type

string

padrão:"single"

Tipo de tomada. single é tomada única (padrão), multi é múltiplas tomadas. O parâmetro tem prioridade maior que o prompt.Valores opcionais: single, multi

watermark

boolean

padrão:false

Se deve adicionar uma marca d’água; a marca d’água fica no canto inferior direito do vídeo.

negative_prompt

string

Prompt negativo, usado para descrever conteúdos que você não deseja que apareçam nas imagens do vídeo. Suporta chinês e inglês, com no máximo 500 caracteres.Limite de comprimento: 0 - 500

Informações da resposta

task_id

string

Use o task_id para solicitar a API de consulta de resultado da tarefa e recuperar a saída gerada.

Wanxiang Wan 2.7 Texto para vídeo

Edição de vídeo Wan 2.7 da Wanxiang

​Cabeçalhos da solicitação

​Corpo da solicitação

​Informações da resposta

Cabeçalhos da solicitação

Corpo da solicitação

Informações da resposta