Génération vidéo Seedance 2.0
Vidéo
Génération vidéo Seedance 2.0
POST
Génération vidéo Seedance 2.0
La série de modèles Seedance 2.0 prend en charge l’entrée de contenus multimodaux tels que des images, des vidéos, de l’audio et du texte. Elle offre des capacités de génération vidéo, d’édition vidéo et d’extension vidéo, peut restituer avec une grande précision les détails des objets, les timbres, les effets, les styles, les mouvements de caméra, etc., tout en conservant des caractéristiques de personnage stables. Elle prend en charge la génération texte-vers-vidéo, image-vers-vidéo (première image / première et dernière image) et la génération vidéo avec références multimodales (combinaison image + vidéo + audio). Deux versions sont disponibles : la version standard (seedance-2.0) et la version rapide (seedance-2.0-fast), cette dernière étant moins chère et plus rapide à générer.
Informations sur la consommation minimale
- SKU applicable : génération vidéo avec références multimodales (avec entrée vidéo, c’est-à-dire la série MULTI_REF_VID)
- Règle de facturation : montant réellement déduit = max(prix par seconde × durée totale de la vidéo, consommation minimale)
- Scénario de déclenchement : lorsque la vidéo fournie par l’utilisateur est très courte (par exemple 1 à 2 secondes) et que la sortie est également courte, le montant calculé à la seconde peut être inférieur au coût correspondant à la consommation minimale de tokens du fournisseur ; dans ce cas, la consommation minimale s’applique
- Exemple de scénario : un client souhaite générer une vidéo promotionnelle produit de 4 secondes, charge une vidéo promotionnelle produit de 2 secondes, souhaite modifier l’arrière-plan et les couleurs, sans autre élément d’entrée ; la vidéo étant relativement simple, le prix par seconde × la durée vidéo donne une consommation de seulement 0.30)
Tableau de consommation minimale
| Durée de sortie (s) | 2.0-480P | 2.0-720P | 2.0-1080P | fast-480P | fast-720P |
|---|---|---|---|---|---|
| 4 | $0.30 | $0.65 | $1.64 | $0.23 | $0.50 |
| 5 | $0.39 | $0.84 | $2.06 | $0.30 | $0.64 |
| 6 | $0.43 | $0.93 | $2.47 | $0.33 | $0.71 |
| 7 | $0.52 | $1.11 | $2.88 | $0.40 | $0.85 |
| 8 | $0.61 | $1.30 | $3.29 | $0.46 | $1.00 |
| 9 | $0.65 | $1.39 | $3.70 | $0.50 | $1.07 |
| 10 | $0.73 | $1.58 | $4.11 | $0.56 | $1.21 |
| 11 | $0.82 | $1.76 | $4.52 | $0.63 | $1.35 |
| 12 | $0.86 | $1.86 | $4.93 | $0.66 | $1.43 |
| 13 | $0.95 | $2.04 | $5.35 | $0.73 | $1.57 |
| 14 | $1.04 | $2.23 | $5.76 | $0.79 | $1.71 |
| 15 | $1.08 | $2.32 | $6.17 | $0.83 | $1.78 |
En-têtes de requête
Valeur d’énumération :
application/jsonFormat d’authentification Bearer : Bearer {{API Key}}.
Corps de la requête
Indique s’il faut utiliser le modèle en version rapide (seedance-2.0-fast). La version rapide est moins chère et plus rapide à générer.
Graine aléatoire utilisée pour contrôler le caractère aléatoire du contenu généré. Plage de valeurs [-1, 2^32-1] ; -1 signifie aléatoire.Plage de valeurs : [-1, +∞]
URL ou encodage Base64 de l’image de première image. Utilisé pour le mode image-vers-vidéo avec première image. Formats pris en charge : jpeg/png/webp/bmp/tiff/gif. Plage de rapports largeur/hauteur : (0.4, 2.5), plage de dimensions en pixels largeur/hauteur : (300, 6000), taille maximale par image : 30MB.
Rapport largeur/hauteur de la vidéo générée. adaptive signifie que le rapport le plus approprié est automatiquement sélectionné selon l’entrée.Valeurs possibles :
16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptiveInvite textuelle décrivant la vidéo que vous souhaitez générer. Le chinois et l’anglais sont pris en charge ; il est recommandé de ne pas dépasser 500 caractères en chinois et 1000 mots en anglais. Obligatoire en mode texte-vers-vidéo, optionnel dans les autres modes.
Durée de la vidéo générée (secondes). Plage [4,15]Plage de valeurs : [4, 15]
Indique si la vidéo générée contient un filigrane.
URL ou encodage Base64 de l’image de dernière image. Doit être fourni conjointement avec le champ image pour réaliser le mode image-vers-vidéo avec première et dernière image. Fournir last_image seul sans image est invalide. Si les rapports largeur/hauteur des images de première et de dernière image ne sont pas cohérents, la première image prévaut et la dernière image est automatiquement recadrée pour s’adapter.
Résolution vidéo. 1080p est pris en charge uniquement par la version standard (fast=false).Valeurs possibles :
480p, 720p, 1080pIndique s’il faut activer la recherche en ligne. Une fois activée, le modèle détermine de manière autonome, selon l’invite, s’il doit rechercher du contenu sur Internet, ce qui peut améliorer l’actualité des résultats mais augmente la latence.
Indique s’il faut générer un son synchronisé avec l’image. Lorsque true, le modèle génère automatiquement des voix, des effets sonores et une musique de fond adaptés sur la base du texte et du contenu visuel.
Liste d’audios de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL audio ou un encodage Base64. Formats wav/mp3, durée individuelle [2,15]s, durée totale de tous les audios ne dépassant pas 15s, taille individuelle maximale 15MB. Il n’est pas possible de fournir uniquement de l’audio ; au moins 1 image ou vidéo de référence doit être incluse.Longueur du tableau : 1 - 3
Liste d’images de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL d’image ou un encodage Base64. Jusqu’à 9 images. Vous pouvez préciser la méthode de combinaison des images via l’invite ; il est recommandé d’utiliser le format « [图1]xxx,[图2]xxx ».Longueur du tableau : 1 - 9
Liste de vidéos de référence, utilisée pour le mode génération vidéo avec références multimodales. Chaque élément est une URL vidéo. Formats mp4/mov, résolution 480p/720p, durée individuelle [2,15]s, durée totale de toutes les vidéos ne dépassant pas 15s, taille individuelle maximale 50MB.Longueur du tableau : 1 - 3
Indique s’il faut renvoyer l’image de dernière image de la vidéo générée (format png, sans filigrane). Peut être utilisé pour la génération vidéo continue : la dernière image sert de première image pour le segment vidéo suivant.
Informations de réponse
Utilisez task_id pour appeler l’API de requête du résultat de tâche afin de récupérer la sortie générée.