Geração de vídeo Seedance 2.0
Vídeo
Geração de vídeo Seedance 2.0
POST
Geração de vídeo Seedance 2.0
A série de modelos Seedance 2.0 oferece suporte à entrada de conteúdo em várias modalidades, como imagem, vídeo, áudio e texto, com capacidades de geração de vídeo, edição de vídeo, extensão de vídeo e outras. Ela consegue restaurar com alta precisão detalhes de objetos, timbre, efeitos, estilo, movimentos de câmera etc., mantendo características estáveis dos personagens. Suporta texto para vídeo, imagem para vídeo (quadro inicial/quadro inicial e final) e geração de vídeo com referências multimodais (combinações de imagem + vídeo + áudio). Disponível na versão padrão (seedance-2.0) e na versão rápida (seedance-2.0-fast); a versão rápida tem preço menor e gera mais rapidamente.
Explicação sobre consumo mínimo
- SKU aplicável: geração de vídeo com referências multimodais (inclui entrada de vídeo, ou seja, série MULTI_REF_VID)
- Regra de cobrança: valor efetivamente cobrado = max(preço por segundo × duração total do vídeo em segundos, consumo mínimo)
- Cenário de acionamento: quando o vídeo enviado pelo usuário é muito curto (por exemplo, 1~2 segundos) e a saída também é curta, o valor calculado por segundo pode ser menor que o custo correspondente ao consumo mínimo de tokens do fornecedor; nesse caso, aplica-se o consumo mínimo como piso
- Exemplo de cenário: um cliente deseja gerar um vídeo promocional de produto de 4 segundos, envia um vídeo promocional do produto de 2 segundos e espera modificar o fundo e as cores, sem outros elementos de entrada. Como o vídeo é relativamente simples, o cálculo preço por segundo × duração do vídeo resulta em apenas 0.30)
Tabela de consumo mínimo
| Duração de saída em segundos | 2.0-480P | 2.0-720P | 2.0-1080P | fast-480P | fast-720P |
|---|---|---|---|---|---|
| 4 | $0.30 | $0.65 | $1.64 | $0.23 | $0.50 |
| 5 | $0.39 | $0.84 | $2.06 | $0.30 | $0.64 |
| 6 | $0.43 | $0.93 | $2.47 | $0.33 | $0.71 |
| 7 | $0.52 | $1.11 | $2.88 | $0.40 | $0.85 |
| 8 | $0.61 | $1.30 | $3.29 | $0.46 | $1.00 |
| 9 | $0.65 | $1.39 | $3.70 | $0.50 | $1.07 |
| 10 | $0.73 | $1.58 | $4.11 | $0.56 | $1.21 |
| 11 | $0.82 | $1.76 | $4.52 | $0.63 | $1.35 |
| 12 | $0.86 | $1.86 | $4.93 | $0.66 | $1.43 |
| 13 | $0.95 | $2.04 | $5.35 | $0.73 | $1.57 |
| 14 | $1.04 | $2.23 | $5.76 | $0.79 | $1.71 |
| 15 | $1.08 | $2.32 | $6.17 | $0.83 | $1.78 |
Cabeçalhos da requisição
Valores enumerados:
application/jsonFormato de autenticação Bearer: Bearer {{API Key}}.
Corpo da requisição
Indica se deve usar o modelo da versão rápida (seedance-2.0-fast). A versão rápida tem preço menor e gera mais rapidamente.
Semente aleatória, usada para controlar a aleatoriedade do conteúdo gerado. Intervalo de valores [-1, 2^32-1]; -1 indica aleatório.Intervalo de valores: [-1, +∞]
URL da imagem do quadro inicial ou codificação Base64. Usado no modo imagem para vídeo com quadro inicial. Formatos compatíveis: jpeg/png/webp/bmp/tiff/gif. Intervalo de proporção (0.4, 2.5), intervalo de pixels de largura e altura (300, 6000), cada imagem com no máximo 30MB.
Proporção do vídeo gerado. adaptive indica que a proporção mais adequada será escolhida automaticamente com base na entrada.Valores opcionais:
16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptivePrompt de texto que descreve o vídeo esperado. Suporta chinês e inglês; recomenda-se no máximo 500 caracteres em chinês e no máximo 1000 palavras em inglês. Obrigatório no modo texto para vídeo; opcional nos demais modos.
Duração do vídeo gerado (em segundos). Intervalo [4,15]Intervalo de valores: [4, 15]
Indica se o vídeo gerado deve conter marca d’água.
URL da imagem do quadro final ou codificação Base64. Deve ser enviado junto com o campo image para habilitar o modo imagem para vídeo com quadro inicial e final. Enviar apenas last_image sem image não tem efeito. Quando as proporções das imagens do quadro inicial e final forem diferentes, a do quadro inicial será usada como referência, e o quadro final será recortado automaticamente para se adaptar.
Resolução do vídeo. 1080p é compatível apenas com a versão padrão (fast=false).Valores opcionais:
480p, 720p, 1080pIndica se a pesquisa na internet deve ser ativada. Quando ativada, o modelo decide autonomamente, com base no prompt, se deve pesquisar conteúdo na internet, o que pode melhorar a atualidade das informações, mas aumenta a latência.
Indica se deve gerar som sincronizado com a imagem. Quando true, o modelo gera automaticamente vozes, efeitos sonoros e música de fundo correspondentes com base no texto e no conteúdo visual.
Lista de áudios de referência, usada no modo de geração de vídeo com referências multimodais. Cada item é uma URL de áudio ou codificação Base64. Formato wav/mp3, duração individual [2,15]s, duração total de todos os áudios não superior a 15s, cada item com no máximo 15MB. Não é permitido fornecer apenas áudio; é necessário incluir pelo menos 1 imagem ou vídeo de referência.Tamanho do array: 1 - 3
Lista de imagens de referência, usada no modo de geração de vídeo com referências multimodais. Cada item é uma URL de imagem ou codificação Base64. Máximo de 9 imagens. É possível especificar, por meio do prompt, como as imagens devem ser combinadas; recomenda-se usar o formato 「[图1]xxx,[图2]xxx」.Tamanho do array: 1 - 9
Lista de vídeos de referência, usada no modo de geração de vídeo com referências multimodais. Cada item é uma URL de vídeo. Formato mp4/mov, resolução 480p/720p, duração individual [2,15]s, duração total de todos os vídeos não superior a 15s, cada item com no máximo 50MB.Tamanho do array: 1 - 3
Indica se deve retornar a imagem do quadro final do vídeo gerado (formato png, sem marca d’água). Pode ser usada para geração contínua de vídeos: usar o quadro final como quadro inicial do próximo segmento de vídeo.
Informações da resposta
Use o task_id para solicitar a API de consulta do resultado da tarefa e recuperar a saída gerada.