Generación de video Seedance 2.0
Vídeo
Generación de video Seedance 2.0
POST
Generación de video Seedance 2.0
La serie de modelos Seedance 2.0 admite entradas de contenido multimodal como imágenes, video, audio y texto. Ofrece capacidades de generación de video, edición de video y extensión de video, y puede reproducir con alta precisión detalles de objetos, timbres, efectos, estilos y movimientos de cámara, manteniendo estables las características de los personajes. Admite texto a video, imagen a video (primer fotograma / primer y último fotograma) y generación de video con referencias multimodales (combinaciones de imagen + video + audio). Ofrece una versión estándar (seedance-2.0) y una versión rápida (seedance-2.0-fast); la versión rápida tiene menor coste y genera más rápido.
Descripción del consumo mínimo
- SKU aplicable: generación de video con referencias multimodales (incluye entrada de video, es decir, serie MULTI_REF_VID)
- Regla de facturación: cargo real = max(precio por segundo × segundos totales de video, consumo mínimo)
- Escenario de activación: cuando el video de entrada del usuario es muy corto (por ejemplo, 1~2 segundos) y la salida también es corta, el importe calculado por segundo puede ser inferior al coste correspondiente al consumo mínimo de tokens del proveedor; en ese caso, se aplica el consumo mínimo como límite inferior
- Ejemplo de escenario: un cliente quiere generar un video promocional de producto de 4 segundos, sube un video promocional de producto de 2 segundos y espera modificar el fondo y el color, sin otros elementos de entrada. Como el video es relativamente simple, el precio por segundo × segundos de video calcula un consumo de solo 0.30)
Tabla de consumo mínimo
| Segundos de salida | 2.0-480P | 2.0-720P | 2.0-1080P | fast-480P | fast-720P |
|---|---|---|---|---|---|
| 4 | $0.30 | $0.65 | $1.64 | $0.23 | $0.50 |
| 5 | $0.39 | $0.84 | $2.06 | $0.30 | $0.64 |
| 6 | $0.43 | $0.93 | $2.47 | $0.33 | $0.71 |
| 7 | $0.52 | $1.11 | $2.88 | $0.40 | $0.85 |
| 8 | $0.61 | $1.30 | $3.29 | $0.46 | $1.00 |
| 9 | $0.65 | $1.39 | $3.70 | $0.50 | $1.07 |
| 10 | $0.73 | $1.58 | $4.11 | $0.56 | $1.21 |
| 11 | $0.82 | $1.76 | $4.52 | $0.63 | $1.35 |
| 12 | $0.86 | $1.86 | $4.93 | $0.66 | $1.43 |
| 13 | $0.95 | $2.04 | $5.35 | $0.73 | $1.57 |
| 14 | $1.04 | $2.23 | $5.76 | $0.79 | $1.71 |
| 15 | $1.08 | $2.32 | $6.17 | $0.83 | $1.78 |
Encabezados de solicitud
Valor enumerado:
application/jsonFormato de autenticación Bearer: Bearer {{API Key}}.
Cuerpo de la solicitud
Indica si se usa el modelo de versión rápida (seedance-2.0-fast). La versión rápida tiene menor coste y genera más rápido.
Semilla aleatoria, utilizada para controlar la aleatoriedad del contenido generado. Rango de valores [-1, 2^32-1]; -1 indica aleatorio.Rango de valores: [-1, +∞]
URL de la imagen del primer fotograma o codificación Base64. Se usa para el modo imagen a video - primer fotograma. Formatos compatibles: jpeg/png/webp/bmp/tiff/gif. Rango de relación de aspecto (0.4, 2.5), rango de píxeles de ancho y alto (300, 6000), y cada imagen no debe superar 30MB.
Relación de aspecto del video generado. adaptive indica que se selecciona automáticamente la relación de aspecto más adecuada según la entrada.Valores opcionales:
16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptivePrompt de texto que describe el video que se espera generar. Admite chino e inglés; se recomienda que el chino no supere 500 caracteres y el inglés no supere 1000 palabras. Es obligatorio en el modo texto a video y opcional en otros modos.
Duración del video generado (segundos). Rango [4,15]Rango de valores: [4, 15]
Indica si el video generado incluye marca de agua.
URL de la imagen del último fotograma o codificación Base64. Debe enviarse junto con el campo image para habilitar el modo imagen a video - primer y último fotograma. Enviar last_image por separado sin image no tiene efecto. Si las relaciones de aspecto de las imágenes del primer y último fotograma no coinciden, prevalece la del primer fotograma y el último fotograma se recorta automáticamente para adaptarse.
Resolución del video. 1080p solo es compatible con la versión estándar (fast=false).Valores opcionales:
480p, 720p, 1080pIndica si se habilita la búsqueda en la web. Al habilitarla, el modelo determina de forma autónoma si debe buscar contenido en Internet según el prompt; puede mejorar la actualidad de la información, pero aumenta la latencia.
Indica si se genera sonido sincronizado con la imagen. Cuando es true, el modelo genera automáticamente voces, efectos de sonido y música de fondo que coinciden con el contenido textual y visual.
Lista de audios de referencia, utilizada para el modo de generación de video con referencias multimodales. Cada elemento es una URL de audio o codificación Base64. Formato wav/mp3, duración individual [2,15]s, duración total de todos los audios no superior a 15s, y cada archivo no debe superar 15MB. No se puede introducir audio de forma independiente; debe incluir al menos 1 imagen o video de referencia.Longitud del array: 1 - 3
Lista de imágenes de referencia, utilizada para el modo de generación de video con referencias multimodales. Cada elemento es una URL de imagen o codificación Base64. Máximo 9 imágenes. Puede especificar mediante el prompt cómo combinar las imágenes; se recomienda usar el formato «[图1]xxx,[图2]xxx».Longitud del array: 1 - 9
Lista de videos de referencia, utilizada para el modo de generación de video con referencias multimodales. Cada elemento es una URL de video. Formato mp4/mov, resolución 480p/720p, duración individual [2,15]s, duración total de todos los videos no superior a 15s, y cada archivo no debe superar 50MB.Longitud del array: 1 - 3
Indica si se devuelve la imagen del último fotograma del video generado (formato png, sin marca de agua). Puede usarse para la generación de video continuo: usar el último fotograma como primer fotograma del siguiente segmento de video.
Información de respuesta
Use task_id para solicitar la API de consulta del resultado de la tarea y recuperar la salida generada.