Wanxiang Wan 2.7 — vidéo générée à partir de références
Vidéo
Wanxiang Wan 2.7 — vidéo générée à partir de références
POST
Wanxiang Wan 2.7 — vidéo générée à partir de références
Le modèle Wanxiang Wan 2.7 de vidéo générée à partir de références prend en charge les entrées multimodales (texte/image/vidéo) et peut utiliser une personne ou un objet comme protagoniste pour générer des vidéos de performance à rôle unique ou d’interaction entre plusieurs rôles. Il prend en charge le découpage intelligent en scènes afin de générer des vidéos multi-plans. Les résolutions 720P et 1080P sont prises en charge, avec une durée de 2 à 10 secondes et une facturation à la seconde. La sortie inclut l’audio par défaut.
En-têtes de requête
Valeur d’énumération :
application/jsonFormat d’authentification Bearer : Bearer {{API Key}}.
Corps de la requête
Graine aléatoire utilisée pour améliorer la reproductibilité des résultats générés. Plage de valeurs [0, 2147483647].Plage de valeurs : [0, 2147483647]
Résolution de la vidéo de sortie (largeurhauteur), qui influe sur le coût. Gamme 720P : 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Gamme 1080P : 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valeurs possibles :
1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632Indique s’il faut générer une vidéo avec son, ce qui influe sur le coût. Par défaut : true (vidéo avec son).
Tableau de médias de référence, utilisé pour extraire l’apparence du personnage, les mouvements et le timbre vocal. Correspond à character1, character2, etc. dans le prompt selon l’ordre du tableau. Nombre d’images : 0 à 5 ; nombre de vidéos : 0 à 3 ; total maximal : 5. Formats d’image : JPEG, JPG, PNG, BMP, WEBP, résolution [240,8000] pixels, maximum 10 MB. Formats vidéo : MP4, MOV, durée de 1 à 30 secondes, maximum 100 MB. Formats audio : MP3, WAV, FLAC, durée de 3 à 30 secondes.Longueur du tableau : 1 - 5
Prompt textuel utilisé pour décrire les éléments et caractéristiques visuelles souhaités dans la vidéo générée. Les personnages de référence sont cités via des identifiants tels que character1, character2, etc. Chaque référence (vidéo ou image) ne contient qu’un seul personnage. Le chinois et l’anglais sont pris en charge, avec un maximum de 1500 caractères.Limite de longueur : 0 - 1500
Durée de la vidéo générée, en secondes, facturée à la seconde. Doit être un entier dans la plage [2, 10].Plage de valeurs : [2, 10]
Type de plan. single correspond à un plan unique (par défaut), multi à plusieurs plans. Ce paramètre a une priorité supérieure à celle du prompt.Valeurs possibles :
single, multiIndique s’il faut ajouter un filigrane, situé dans l’angle inférieur droit de la vidéo.
Prompt négatif utilisé pour décrire le contenu que vous ne souhaitez pas voir apparaître dans les images de la vidéo. Le chinois et l’anglais sont pris en charge, avec un maximum de 500 caractères.Limite de longueur : 0 - 500
Informations de réponse
Utilisez le task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.