Génération vidéo Seedance 2.0

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

POST

async

seedance-2.0

Génération vidéo Seedance 2.0

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

La série de modèles Seedance 2.0 prend en charge l’entrée de contenus multimodaux tels que des images, des vidéos, de l’audio et du texte. Elle offre des capacités de génération vidéo, d’édition vidéo et d’extension vidéo, peut restituer avec une grande précision les détails des objets, les timbres, les effets, les styles, les mouvements de caméra, etc., tout en conservant des caractéristiques de personnage stables. Elle prend en charge la génération texte-vers-vidéo, image-vers-vidéo (première image / première et dernière image) et la génération vidéo avec références multimodales (combinaison image + vidéo + audio). Deux versions sont disponibles : la version standard (seedance-2.0) et la version rapide (seedance-2.0-fast), cette dernière étant moins chère et plus rapide à générer.

Informations sur la consommation minimale

SKU applicable : génération vidéo avec références multimodales (avec entrée vidéo, c’est-à-dire la série MULTI_REF_VID)
Règle de facturation : montant réellement déduit = max(prix par seconde × durée totale de la vidéo, consommation minimale)
Scénario de déclenchement : lorsque la vidéo fournie par l’utilisateur est très courte (par exemple 1 à 2 secondes) et que la sortie est également courte, le montant calculé à la seconde peut être inférieur au coût correspondant à la consommation minimale de tokens du fournisseur ; dans ce cas, la consommation minimale s’applique
Exemple de scénario : un client souhaite générer une vidéo promotionnelle produit de 4 secondes, charge une vidéo promotionnelle produit de 2 secondes, souhaite modifier l’arrière-plan et les couleurs, sans autre élément d’entrée ; la vidéo étant relativement simple, le prix par seconde × la durée vidéo donne une consommation de seulement $0.19 pour cette génération. Cependant, comme un support vidéo a été chargé, la consommation minimale est déclenchée et la facturation se fait directement selon la consommation minimale du palier 4 secondes ($ 0.30)

Tableau de consommation minimale

Durée de sortie (s)	2.0-480P	2.0-720P	2.0-1080P	fast-480P	fast-720P
4	$0.30	$0.65	$1.64	$0.23	$0.50
5	$0.39	$0.84	$2.06	$0.30	$0.64
6	$0.43	$0.93	$2.47	$0.33	$0.71
7	$0.52	$1.11	$2.88	$0.40	$0.85
8	$0.61	$1.30	$3.29	$0.46	$1.00
9	$0.65	$1.39	$3.70	$0.50	$1.07
10	$0.73	$1.58	$4.11	$0.56	$1.21
11	$0.82	$1.76	$4.52	$0.63	$1.35
12	$0.86	$1.86	$4.93	$0.66	$1.43
13	$0.95	$2.04	$5.35	$0.73	$1.57
14	$1.04	$2.23	$5.76	$0.79	$1.71
15	$1.08	$2.32	$6.17	$0.83	$1.78

Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de requête du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

Content-Type

string

requis

Valeur d’énumération : application/json

Authorization

string

requis

Format d’authentification Bearer : Bearer {{API Key}}.

Corps de la requête

fast

boolean

défaut:false

Indique s’il faut utiliser le modèle en version rapide (seedance-2.0-fast). La version rapide est moins chère et plus rapide à générer.

seed

integer

Graine aléatoire utilisée pour contrôler le caractère aléatoire du contenu généré. Plage de valeurs [-1, 2^32-1] ; -1 signifie aléatoire.Plage de valeurs : [-1, +∞]

image

string

URL ou encodage Base64 de l’image de première image. Utilisé pour le mode image-vers-vidéo avec première image. Formats pris en charge : jpeg/png/webp/bmp/tiff/gif. Plage de rapports largeur/hauteur : (0.4, 2.5), plage de dimensions en pixels largeur/hauteur : (300, 6000), taille maximale par image : 30MB.

ratio

string

défaut:"adaptive"

Rapport largeur/hauteur de la vidéo générée. adaptive signifie que le rapport le plus approprié est automatiquement sélectionné selon l’entrée.Valeurs possibles : 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive

prompt

string

Invite textuelle décrivant la vidéo que vous souhaitez générer. Le chinois et l’anglais sont pris en charge ; il est recommandé de ne pas dépasser 500 caractères en chinois et 1000 mots en anglais. Obligatoire en mode texte-vers-vidéo, optionnel dans les autres modes.

duration

integer

défaut:5

Durée de la vidéo générée (secondes). Plage [4,15]Plage de valeurs : [4, 15]

watermark

boolean

défaut:false

Indique si la vidéo générée contient un filigrane.

last_image

string

URL ou encodage Base64 de l’image de dernière image. Doit être fourni conjointement avec le champ image pour réaliser le mode image-vers-vidéo avec première et dernière image. Fournir last_image seul sans image est invalide. Si les rapports largeur/hauteur des images de première et de dernière image ne sont pas cohérents, la première image prévaut et la dernière image est automatiquement recadrée pour s’adapter.

resolution

string

défaut:"720p"

Résolution vidéo. 1080p est pris en charge uniquement par la version standard (fast=false).Valeurs possibles : 480p, 720p, 1080p

web_search

boolean

défaut:false

Indique s’il faut activer la recherche en ligne. Une fois activée, le modèle détermine de manière autonome, selon l’invite, s’il doit rechercher du contenu sur Internet, ce qui peut améliorer l’actualité des résultats mais augmente la latence.

generate_audio

boolean

défaut:true

Indique s’il faut générer un son synchronisé avec l’image. Lorsque true, le modèle génère automatiquement des voix, des effets sonores et une musique de fond adaptés sur la base du texte et du contenu visuel.

reference_audios

array

Liste d’audios de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL audio ou un encodage Base64. Formats wav/mp3, durée individuelle [2,15]s, durée totale de tous les audios ne dépassant pas 15s, taille individuelle maximale 15MB. Il n’est pas possible de fournir uniquement de l’audio ; au moins 1 image ou vidéo de référence doit être incluse.Longueur du tableau : 1 - 3

reference_images

array

Liste d’images de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL d’image ou un encodage Base64. Jusqu’à 9 images. Vous pouvez préciser la méthode de combinaison des images via l’invite ; il est recommandé d’utiliser le format « [图1]xxx，[图2]xxx ».Longueur du tableau : 1 - 9

reference_videos

array

Liste de vidéos de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL vidéo. Formats mp4/mov, résolution 480p/720p, durée individuelle [2,15]s, durée totale de toutes les vidéos ne dépassant pas 15s, taille individuelle maximale 50MB.Longueur du tableau : 1 - 3

return_last_frame

boolean

défaut:false

Indique s’il faut renvoyer l’image de dernière image de la vidéo générée (format png, sans filigrane). Peut être utilisé pour la génération vidéo continue : la dernière image sert de première image pour le segment vidéo suivant.

Informations de réponse

task_id

string

requis

Utilisez task_id pour appeler l’API de requête du résultat de tâche afin de récupérer la sortie générée.

Génération vidéo Veo 3.1 Fast à partir des images initiale et finale

VIDU Q2 Pro Fast — Vidéo à partir d’une référence

​Informations sur la consommation minimale

​Tableau de consommation minimale

​En-têtes de requête

​Corps de la requête

​Informations de réponse

Informations sur la consommation minimale

Tableau de consommation minimale

En-têtes de requête

Corps de la requête

Informations de réponse