Wanxiang Wan 2.7 image vers vidéo
Vidéo
Wanxiang Wan 2.7 image vers vidéo
POST
Wanxiang Wan 2.7 image vers vidéo
Le modèle Wanxiang Wan 2.7 image vers vidéo prend en charge les entrées multimodales (texte/image/audio/vidéo) et peut réaliser trois types de tâches : génération de vidéo à partir d’une première image, génération de vidéo à partir d’une image de début et de fin, et prolongation de vidéo. Il prend en charge les résolutions 720P et 1080P, une durée de 2 à 15 secondes, avec une facturation à la seconde. La sortie inclut l’audio par défaut.
En-têtes de requête
Valeurs énumérées :
application/jsonFormat d’authentification Bearer : Bearer {{clé API}}.
Corps de la requête
Graine aléatoire, utilisée pour améliorer la reproductibilité des résultats générés. Plage de valeurs [0, 2147483647].Plage de valeurs : [0, 2147483647]
Prompt textuel utilisé pour décrire les éléments et caractéristiques visuelles souhaités dans la vidéo générée. Le chinois et l’anglais sont pris en charge, avec un maximum de 5000 caractères.Limite de longueur : 0 - 5000
Durée de la vidéo générée, en secondes, facturée à la seconde. Entier dans la plage [2, 15].Plage de valeurs : [2, 15]
URL de l’image de première image. Formats pris en charge : JPEG, JPG, PNG (canal transparent non pris en charge), BMP, WEBP. Largeur et hauteur de résolution dans la plage [240, 8000] pixels, rapport largeur/hauteur de 1:8 à 8:1, taille de fichier ne dépassant pas 20 MB. À choisir avec first_clip_url ; au moins l’un des deux doit être fourni.
Indique s’il faut ajouter un filigrane ; le filigrane est placé dans le coin inférieur droit de la vidéo.
Niveau de résolution de la vidéo de sortie, qui affecte le coût. Le rapport largeur/hauteur de la vidéo reste identique à celui du contenu d’entrée.Valeurs possibles :
720P, 1080PIndique s’il faut activer la réécriture intelligente du prompt. Une fois activée, un grand modèle est utilisé pour réécrire intelligemment le prompt d’entrée, ce qui améliore nettement les résultats pour les prompts courts, mais augmente le temps de traitement.
URL du premier segment vidéo, utilisée pour la prolongation de vidéo. Le modèle générera la suite à partir du contenu de cette vidéo. Formats pris en charge : mp4, mov ; durée de 2 à 10 secondes ; largeur et hauteur de résolution dans la plage [240, 4096] pixels ; rapport largeur/hauteur de 1:8 à 8:1 ; taille de fichier ne dépassant pas 100 MB. À choisir avec image_url.
URL de l’image de fin. Associée à la première image, elle permet de générer une vidéo avec image de début et de fin. Les restrictions de format sont identiques à celles de la première image.
Prompt négatif utilisé pour décrire le contenu que vous ne souhaitez pas voir apparaître dans les images de la vidéo. Le chinois et l’anglais sont pris en charge, avec un maximum de 500 caractères.Limite de longueur : 0 - 500
URL de l’audio de pilotage. Lorsqu’il est fourni, le modèle utilise cet audio comme source de pilotage pour générer la vidéo (par exemple synchronisation labiale, synchronisation des mouvements sur le rythme, etc.). S’il n’est pas fourni, le modèle génère automatiquement une musique de fond ou des effets sonores adaptés. Formats pris en charge : wav, mp3 ; durée de 2 à 30 secondes ; taille de fichier ne dépassant pas 15 MB.
Informations de réponse
Utilisez le task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.