Passer au contenu principal
POST
/
v3
/
async
/
seedance-2.0
Génération vidéo Seedance 2.0
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'
{
  "task_id": "<string>"
}
La série de modèles Seedance 2.0 prend en charge l’entrée de contenus multimodaux tels que des images, des vidéos, de l’audio et du texte. Elle offre des capacités de génération vidéo, d’édition vidéo et d’extension vidéo, peut restituer avec une grande précision les détails des objets, les timbres, les effets, les styles, les mouvements de caméra, etc., tout en conservant des caractéristiques de personnage stables. Elle prend en charge la génération texte-vers-vidéo, image-vers-vidéo (première image / première et dernière image) et la génération vidéo avec références multimodales (combinaison image + vidéo + audio). Deux versions sont disponibles : la version standard (seedance-2.0) et la version rapide (seedance-2.0-fast), cette dernière étant moins chère et plus rapide à générer.

Informations sur la consommation minimale

  • SKU applicable : génération vidéo avec références multimodales (avec entrée vidéo, c’est-à-dire la série MULTI_REF_VID)
  • Règle de facturation : montant réellement déduit = max(prix par seconde × durée totale de la vidéo, consommation minimale)
  • Scénario de déclenchement : lorsque la vidéo fournie par l’utilisateur est très courte (par exemple 1 à 2 secondes) et que la sortie est également courte, le montant calculé à la seconde peut être inférieur au coût correspondant à la consommation minimale de tokens du fournisseur ; dans ce cas, la consommation minimale s’applique
  • Exemple de scénario : un client souhaite générer une vidéo promotionnelle produit de 4 secondes, charge une vidéo promotionnelle produit de 2 secondes, souhaite modifier l’arrière-plan et les couleurs, sans autre élément d’entrée ; la vidéo étant relativement simple, le prix par seconde × la durée vidéo donne une consommation de seulement 0.19pourcettegeˊneˊration.Cependant,commeunsupportvideˊoaeˊteˊchargeˊ,laconsommationminimaleestdeˊclencheˊeetlafacturationsefaitdirectementselonlaconsommationminimaledupalier4secondes(0.19 pour cette génération. Cependant, comme un support vidéo a été chargé, la consommation minimale est déclenchée et la facturation se fait directement selon la consommation minimale du palier 4 secondes (0.30)

Tableau de consommation minimale

Durée de sortie (s)2.0-480P2.0-720P2.0-1080Pfast-480Pfast-720P
4$0.30$0.65$1.64$0.23$0.50
5$0.39$0.84$2.06$0.30$0.64
6$0.43$0.93$2.47$0.33$0.71
7$0.52$1.11$2.88$0.40$0.85
8$0.61$1.30$3.29$0.46$1.00
9$0.65$1.39$3.70$0.50$1.07
10$0.73$1.58$4.11$0.56$1.21
11$0.82$1.76$4.52$0.63$1.35
12$0.86$1.86$4.93$0.66$1.43
13$0.95$2.04$5.35$0.73$1.57
14$1.04$2.23$5.76$0.79$1.71
15$1.08$2.32$6.17$0.83$1.78
Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de requête du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

Content-Type
string
requis
Valeur d’énumération : application/json
Authorization
string
requis
Format d’authentification Bearer : Bearer {{API Key}}.

Corps de la requête

fast
boolean
défaut:false
Indique s’il faut utiliser le modèle en version rapide (seedance-2.0-fast). La version rapide est moins chère et plus rapide à générer.
seed
integer
Graine aléatoire utilisée pour contrôler le caractère aléatoire du contenu généré. Plage de valeurs [-1, 2^32-1] ; -1 signifie aléatoire.Plage de valeurs : [-1, +∞]
image
string
URL ou encodage Base64 de l’image de première image. Utilisé pour le mode image-vers-vidéo avec première image. Formats pris en charge : jpeg/png/webp/bmp/tiff/gif. Plage de rapports largeur/hauteur : (0.4, 2.5), plage de dimensions en pixels largeur/hauteur : (300, 6000), taille maximale par image : 30MB.
ratio
string
défaut:"adaptive"
Rapport largeur/hauteur de la vidéo générée. adaptive signifie que le rapport le plus approprié est automatiquement sélectionné selon l’entrée.Valeurs possibles : 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive
prompt
string
Invite textuelle décrivant la vidéo que vous souhaitez générer. Le chinois et l’anglais sont pris en charge ; il est recommandé de ne pas dépasser 500 caractères en chinois et 1000 mots en anglais. Obligatoire en mode texte-vers-vidéo, optionnel dans les autres modes.
duration
integer
défaut:5
Durée de la vidéo générée (secondes). Plage [4,15]Plage de valeurs : [4, 15]
watermark
boolean
défaut:false
Indique si la vidéo générée contient un filigrane.
last_image
string
URL ou encodage Base64 de l’image de dernière image. Doit être fourni conjointement avec le champ image pour réaliser le mode image-vers-vidéo avec première et dernière image. Fournir last_image seul sans image est invalide. Si les rapports largeur/hauteur des images de première et de dernière image ne sont pas cohérents, la première image prévaut et la dernière image est automatiquement recadrée pour s’adapter.
resolution
string
défaut:"720p"
Résolution vidéo. 1080p est pris en charge uniquement par la version standard (fast=false).Valeurs possibles : 480p, 720p, 1080p
Indique s’il faut activer la recherche en ligne. Une fois activée, le modèle détermine de manière autonome, selon l’invite, s’il doit rechercher du contenu sur Internet, ce qui peut améliorer l’actualité des résultats mais augmente la latence.
generate_audio
boolean
défaut:true
Indique s’il faut générer un son synchronisé avec l’image. Lorsque true, le modèle génère automatiquement des voix, des effets sonores et une musique de fond adaptés sur la base du texte et du contenu visuel.
reference_audios
array
Liste d’audios de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL audio ou un encodage Base64. Formats wav/mp3, durée individuelle [2,15]s, durée totale de tous les audios ne dépassant pas 15s, taille individuelle maximale 15MB. Il n’est pas possible de fournir uniquement de l’audio ; au moins 1 image ou vidéo de référence doit être incluse.Longueur du tableau : 1 - 3
reference_images
array
Liste d’images de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL d’image ou un encodage Base64. Jusqu’à 9 images. Vous pouvez préciser la méthode de combinaison des images via l’invite ; il est recommandé d’utiliser le format « [图1]xxx,[图2]xxx ».Longueur du tableau : 1 - 9
reference_videos
array
Liste de vidéos de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL vidéo. Formats mp4/mov, résolution 480p/720p, durée individuelle [2,15]s, durée totale de toutes les vidéos ne dépassant pas 15s, taille individuelle maximale 50MB.Longueur du tableau : 1 - 3
return_last_frame
boolean
défaut:false
Indique s’il faut renvoyer l’image de dernière image de la vidéo générée (format png, sans filigrane). Peut être utilisé pour la génération vidéo continue : la dernière image sert de première image pour le segment vidéo suivant.

Informations de réponse

task_id
string
requis
Utilisez task_id pour appeler l’API de requête du résultat de tâche afin de récupérer la sortie générée.