Geração de vídeo Seedance 2.0

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

POST

async

seedance-2.0

Geração de vídeo Seedance 2.0

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

A série de modelos Seedance 2.0 oferece suporte à entrada de conteúdo em várias modalidades, como imagem, vídeo, áudio e texto, com capacidades de geração de vídeo, edição de vídeo, extensão de vídeo e outras. Ela consegue restaurar com alta precisão detalhes de objetos, timbre, efeitos, estilo, movimentos de câmera etc., mantendo características estáveis dos personagens. Suporta texto para vídeo, imagem para vídeo (quadro inicial/quadro inicial e final) e geração de vídeo com referências multimodais (combinações de imagem + vídeo + áudio). Disponível na versão padrão (seedance-2.0) e na versão rápida (seedance-2.0-fast); a versão rápida tem preço menor e gera mais rapidamente.

Explicação sobre consumo mínimo

SKU aplicável: geração de vídeo com referências multimodais (inclui entrada de vídeo, ou seja, série MULTI_REF_VID)
Regra de cobrança: valor efetivamente cobrado = max(preço por segundo × duração total do vídeo em segundos, consumo mínimo)
Cenário de acionamento: quando o vídeo enviado pelo usuário é muito curto (por exemplo, 1~2 segundos) e a saída também é curta, o valor calculado por segundo pode ser menor que o custo correspondente ao consumo mínimo de tokens do fornecedor; nesse caso, aplica-se o consumo mínimo como piso
Exemplo de cenário: um cliente deseja gerar um vídeo promocional de produto de 4 segundos, envia um vídeo promocional do produto de 2 segundos e espera modificar o fundo e as cores, sem outros elementos de entrada. Como o vídeo é relativamente simples, o cálculo preço por segundo × duração do vídeo resulta em apenas $0.19 de consumo nesta geração. Porém, como foi enviado um material de vídeo, o consumo mínimo é acionado, e a cobrança é feita diretamente de acordo com o consumo mínimo da faixa de 4 segundos ($ 0.30)

Tabela de consumo mínimo

Duração de saída em segundos	2.0-480P	2.0-720P	2.0-1080P	fast-480P	fast-720P
4	$0.30	$0.65	$1.64	$0.23	$0.50
5	$0.39	$0.84	$2.06	$0.30	$0.64
6	$0.43	$0.93	$2.47	$0.33	$0.71
7	$0.52	$1.11	$2.88	$0.40	$0.85
8	$0.61	$1.30	$3.29	$0.46	$1.00
9	$0.65	$1.39	$3.70	$0.50	$1.07
10	$0.73	$1.58	$4.11	$0.56	$1.21
11	$0.82	$1.76	$4.52	$0.63	$1.35
12	$0.86	$1.86	$4.93	$0.66	$1.43
13	$0.95	$2.04	$5.35	$0.73	$1.57
14	$1.04	$2.23	$5.76	$0.79	$1.71
15	$1.08	$2.32	$6.17	$0.83	$1.78

Esta é uma API assíncrona e retornará apenas o task_id da tarefa assíncrona. Você deve usar esse task_id para solicitar a API de consulta do resultado da tarefa e recuperar o resultado gerado.

Cabeçalhos da requisição

Content-Type

string

obrigatório

Valores enumerados: application/json

Authorization

string

obrigatório

Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da requisição

fast

boolean

padrão:false

Indica se deve usar o modelo da versão rápida (seedance-2.0-fast). A versão rápida tem preço menor e gera mais rapidamente.

seed

integer

Semente aleatória, usada para controlar a aleatoriedade do conteúdo gerado. Intervalo de valores [-1, 2^32-1]; -1 indica aleatório.Intervalo de valores: [-1, +∞]

image

string

URL da imagem do quadro inicial ou codificação Base64. Usado no modo imagem para vídeo com quadro inicial. Formatos compatíveis: jpeg/png/webp/bmp/tiff/gif. Intervalo de proporção (0.4, 2.5), intervalo de pixels de largura e altura (300, 6000), cada imagem com no máximo 30MB.

ratio

string

padrão:"adaptive"

Proporção do vídeo gerado. adaptive indica que a proporção mais adequada será escolhida automaticamente com base na entrada.Valores opcionais: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive

prompt

string

Prompt de texto que descreve o vídeo esperado. Suporta chinês e inglês; recomenda-se no máximo 500 caracteres em chinês e no máximo 1000 palavras em inglês. Obrigatório no modo texto para vídeo; opcional nos demais modos.

duration

integer

padrão:5

Duração do vídeo gerado (em segundos). Intervalo [4,15]Intervalo de valores: [4, 15]

watermark

boolean

padrão:false

Indica se o vídeo gerado deve conter marca d’água.

last_image

string

URL da imagem do quadro final ou codificação Base64. Deve ser enviado junto com o campo image para habilitar o modo imagem para vídeo com quadro inicial e final. Enviar apenas last_image sem image não tem efeito. Quando as proporções das imagens do quadro inicial e final forem diferentes, a do quadro inicial será usada como referência, e o quadro final será recortado automaticamente para se adaptar.

resolution

string

padrão:"720p"

Resolução do vídeo. 1080p é compatível apenas com a versão padrão (fast=false).Valores opcionais: 480p, 720p, 1080p

web_search

boolean

padrão:false

Indica se a pesquisa na internet deve ser ativada. Quando ativada, o modelo decide autonomamente, com base no prompt, se deve pesquisar conteúdo na internet, o que pode melhorar a atualidade das informações, mas aumenta a latência.

generate_audio

boolean

padrão:true

Indica se deve gerar som sincronizado com a imagem. Quando true, o modelo gera automaticamente vozes, efeitos sonoros e música de fundo correspondentes com base no texto e no conteúdo visual.

reference_audios

array

Lista de áudios de referência, usada no modo de geração de vídeo com referências multimodais. Cada item é uma URL de áudio ou codificação Base64. Formato wav/mp3, duração individual [2,15]s, duração total de todos os áudios não superior a 15s, cada item com no máximo 15MB. Não é permitido fornecer apenas áudio; é necessário incluir pelo menos 1 imagem ou vídeo de referência.Tamanho do array: 1 - 3

reference_images

array

Lista de imagens de referência, usada no modo de geração de vídeo com referências multimodais. Cada item é uma URL de imagem ou codificação Base64. Máximo de 9 imagens. É possível especificar, por meio do prompt, como as imagens devem ser combinadas; recomenda-se usar o formato 「[图1]xxx，[图2]xxx」.Tamanho do array: 1 - 9

reference_videos

array

Lista de vídeos de referência, usada no modo de geração de vídeo com referências multimodais. Cada item é uma URL de vídeo. Formato mp4/mov, resolução 480p/720p, duração individual [2,15]s, duração total de todos os vídeos não superior a 15s, cada item com no máximo 50MB.Tamanho do array: 1 - 3

return_last_frame

boolean

padrão:false

Indica se deve retornar a imagem do quadro final do vídeo gerado (formato png, sem marca d’água). Pode ser usada para geração contínua de vídeos: usar o quadro final como quadro inicial do próximo segmento de vídeo.

Informações da resposta

task_id

string

obrigatório

Use o task_id para solicitar a API de consulta do resultado da tarefa e recuperar a saída gerada.

Geração de vídeo com primeiro e último quadro Veo 3.1 Fast

VIDU Q2 Pro Fast Vídeo com referência

​Explicação sobre consumo mínimo

​Tabela de consumo mínimo

​Cabeçalhos da requisição

​Corpo da requisição

​Informações da resposta

Explicação sobre consumo mínimo

Tabela de consumo mínimo

Cabeçalhos da requisição

Corpo da requisição

Informações da resposta