Saltar al contenido principal
POST
/
v3
/
async
/
seedance-2.0
Generación de video Seedance 2.0
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'
{
  "task_id": "<string>"
}
La serie de modelos Seedance 2.0 admite entradas de contenido multimodal como imágenes, video, audio y texto. Ofrece capacidades de generación de video, edición de video y extensión de video, y puede reproducir con alta precisión detalles de objetos, timbres, efectos, estilos y movimientos de cámara, manteniendo estables las características de los personajes. Admite texto a video, imagen a video (primer fotograma / primer y último fotograma) y generación de video con referencias multimodales (combinaciones de imagen + video + audio). Ofrece una versión estándar (seedance-2.0) y una versión rápida (seedance-2.0-fast); la versión rápida tiene menor coste y genera más rápido.

Descripción del consumo mínimo

  • SKU aplicable: generación de video con referencias multimodales (incluye entrada de video, es decir, serie MULTI_REF_VID)
  • Regla de facturación: cargo real = max(precio por segundo × segundos totales de video, consumo mínimo)
  • Escenario de activación: cuando el video de entrada del usuario es muy corto (por ejemplo, 1~2 segundos) y la salida también es corta, el importe calculado por segundo puede ser inferior al coste correspondiente al consumo mínimo de tokens del proveedor; en ese caso, se aplica el consumo mínimo como límite inferior
  • Ejemplo de escenario: un cliente quiere generar un video promocional de producto de 4 segundos, sube un video promocional de producto de 2 segundos y espera modificar el fondo y el color, sin otros elementos de entrada. Como el video es relativamente simple, el precio por segundo × segundos de video calcula un consumo de solo 0.19,peroalhabersesubidomaterialdevideoseactivaelconsumomıˊnimo,porloquesecobradirectamenteseguˊnelconsumomıˊnimodeltramode4segundos(0.19, pero al haberse subido material de video se activa el consumo mínimo, por lo que se cobra directamente según el consumo mínimo del tramo de 4 segundos (0.30)

Tabla de consumo mínimo

Segundos de salida2.0-480P2.0-720P2.0-1080Pfast-480Pfast-720P
4$0.30$0.65$1.64$0.23$0.50
5$0.39$0.84$2.06$0.30$0.64
6$0.43$0.93$2.47$0.33$0.71
7$0.52$1.11$2.88$0.40$0.85
8$0.61$1.30$3.29$0.46$1.00
9$0.65$1.39$3.70$0.50$1.07
10$0.73$1.58$4.11$0.56$1.21
11$0.82$1.76$4.52$0.63$1.35
12$0.86$1.86$4.93$0.66$1.43
13$0.95$2.04$5.35$0.73$1.57
14$1.04$2.23$5.76$0.79$1.71
15$1.08$2.32$6.17$0.83$1.78
Esta es una API asíncrona y solo devolverá el task_id de la tarea asíncrona. Debe usar ese task_id para solicitar la API de consulta del resultado de la tarea y recuperar el resultado generado.

Encabezados de solicitud

Content-Type
string
requerido
Valor enumerado: application/json
Authorization
string
requerido
Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

fast
boolean
predeterminado:false
Indica si se usa el modelo de versión rápida (seedance-2.0-fast). La versión rápida tiene menor coste y genera más rápido.
seed
integer
Semilla aleatoria, utilizada para controlar la aleatoriedad del contenido generado. Rango de valores [-1, 2^32-1]; -1 indica aleatorio.Rango de valores: [-1, +∞]
image
string
URL de la imagen del primer fotograma o codificación Base64. Se usa para el modo imagen a video - primer fotograma. Formatos compatibles: jpeg/png/webp/bmp/tiff/gif. Rango de relación de aspecto (0.4, 2.5), rango de píxeles de ancho y alto (300, 6000), y cada imagen no debe superar 30MB.
ratio
string
predeterminado:"adaptive"
Relación de aspecto del video generado. adaptive indica que se selecciona automáticamente la relación de aspecto más adecuada según la entrada.Valores opcionales: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive
prompt
string
Prompt de texto que describe el video que se espera generar. Admite chino e inglés; se recomienda que el chino no supere 500 caracteres y el inglés no supere 1000 palabras. Es obligatorio en el modo texto a video y opcional en otros modos.
duration
integer
predeterminado:5
Duración del video generado (segundos). Rango [4,15]Rango de valores: [4, 15]
watermark
boolean
predeterminado:false
Indica si el video generado incluye marca de agua.
last_image
string
URL de la imagen del último fotograma o codificación Base64. Debe enviarse junto con el campo image para habilitar el modo imagen a video - primer y último fotograma. Enviar last_image por separado sin image no tiene efecto. Si las relaciones de aspecto de las imágenes del primer y último fotograma no coinciden, prevalece la del primer fotograma y el último fotograma se recorta automáticamente para adaptarse.
resolution
string
predeterminado:"720p"
Resolución del video. 1080p solo es compatible con la versión estándar (fast=false).Valores opcionales: 480p, 720p, 1080p
Indica si se habilita la búsqueda en la web. Al habilitarla, el modelo determina de forma autónoma si debe buscar contenido en Internet según el prompt; puede mejorar la actualidad de la información, pero aumenta la latencia.
generate_audio
boolean
predeterminado:true
Indica si se genera sonido sincronizado con la imagen. Cuando es true, el modelo genera automáticamente voces, efectos de sonido y música de fondo que coinciden con el contenido textual y visual.
reference_audios
array
Lista de audios de referencia, utilizada para el modo de generación de video con referencias multimodales. Cada elemento es una URL de audio o codificación Base64. Formato wav/mp3, duración individual [2,15]s, duración total de todos los audios no superior a 15s, y cada archivo no debe superar 15MB. No se puede introducir audio de forma independiente; debe incluir al menos 1 imagen o video de referencia.Longitud del array: 1 - 3
reference_images
array
Lista de imágenes de referencia, utilizada para el modo de generación de video con referencias multimodales. Cada elemento es una URL de imagen o codificación Base64. Máximo 9 imágenes. Puede especificar mediante el prompt cómo combinar las imágenes; se recomienda usar el formato «[图1]xxx,[图2]xxx».Longitud del array: 1 - 9
reference_videos
array
Lista de videos de referencia, utilizada para el modo de generación de video con referencias multimodales. Cada elemento es una URL de video. Formato mp4/mov, resolución 480p/720p, duración individual [2,15]s, duración total de todos los videos no superior a 15s, y cada archivo no debe superar 50MB.Longitud del array: 1 - 3
return_last_frame
boolean
predeterminado:false
Indica si se devuelve la imagen del último fotograma del video generado (formato png, sin marca de agua). Puede usarse para la generación de video continuo: usar el último fotograma como primer fotograma del siguiente segmento de video.

Información de respuesta

task_id
string
requerido
Use task_id para solicitar la API de consulta del resultado de la tarea y recuperar la salida generada.