Passer au contenu principal
POST
/
v3
/
async
/
wan2.7-i2v
Wanxiang Wan 2.7 image vers vidéo
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "prompt": "<string>",
  "duration": 123,
  "image_url": "<string>",
  "watermark": true,
  "resolution": "<string>",
  "prompt_extend": true,
  "first_clip_url": "<string>",
  "last_frame_url": "<string>",
  "negative_prompt": "<string>",
  "driving_audio_url": "<string>"
}
'
{
  "task_id": "<string>"
}
Le modèle Wanxiang Wan 2.7 image vers vidéo prend en charge les entrées multimodales (texte/image/audio/vidéo) et peut réaliser trois types de tâches : génération de vidéo à partir d’une première image, génération de vidéo à partir d’une image de début et de fin, et prolongation de vidéo. Il prend en charge les résolutions 720P et 1080P, une durée de 2 à 15 secondes, avec une facturation à la seconde. La sortie inclut l’audio par défaut.
Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

Content-Type
string
requis
Valeurs énumérées : application/json
Authorization
string
requis
Format d’authentification Bearer : Bearer {{clé API}}.

Corps de la requête

seed
integer
Graine aléatoire, utilisée pour améliorer la reproductibilité des résultats générés. Plage de valeurs [0, 2147483647].Plage de valeurs : [0, 2147483647]
prompt
string
Prompt textuel utilisé pour décrire les éléments et caractéristiques visuelles souhaités dans la vidéo générée. Le chinois et l’anglais sont pris en charge, avec un maximum de 5000 caractères.Limite de longueur : 0 - 5000
duration
integer
défaut:5
Durée de la vidéo générée, en secondes, facturée à la seconde. Entier dans la plage [2, 15].Plage de valeurs : [2, 15]
image_url
string
requis
URL de l’image de première image. Formats pris en charge : JPEG, JPG, PNG (canal transparent non pris en charge), BMP, WEBP. Largeur et hauteur de résolution dans la plage [240, 8000] pixels, rapport largeur/hauteur de 1:8 à 8:1, taille de fichier ne dépassant pas 20 MB. À choisir avec first_clip_url ; au moins l’un des deux doit être fourni.
watermark
boolean
défaut:false
Indique s’il faut ajouter un filigrane ; le filigrane est placé dans le coin inférieur droit de la vidéo.
resolution
string
défaut:"1080P"
Niveau de résolution de la vidéo de sortie, qui affecte le coût. Le rapport largeur/hauteur de la vidéo reste identique à celui du contenu d’entrée.Valeurs possibles : 720P, 1080P
prompt_extend
boolean
défaut:true
Indique s’il faut activer la réécriture intelligente du prompt. Une fois activée, un grand modèle est utilisé pour réécrire intelligemment le prompt d’entrée, ce qui améliore nettement les résultats pour les prompts courts, mais augmente le temps de traitement.
first_clip_url
string
URL du premier segment vidéo, utilisée pour la prolongation de vidéo. Le modèle générera la suite à partir du contenu de cette vidéo. Formats pris en charge : mp4, mov ; durée de 2 à 10 secondes ; largeur et hauteur de résolution dans la plage [240, 4096] pixels ; rapport largeur/hauteur de 1:8 à 8:1 ; taille de fichier ne dépassant pas 100 MB. À choisir avec image_url.
last_frame_url
string
URL de l’image de fin. Associée à la première image, elle permet de générer une vidéo avec image de début et de fin. Les restrictions de format sont identiques à celles de la première image.
negative_prompt
string
Prompt négatif utilisé pour décrire le contenu que vous ne souhaitez pas voir apparaître dans les images de la vidéo. Le chinois et l’anglais sont pris en charge, avec un maximum de 500 caractères.Limite de longueur : 0 - 500
driving_audio_url
string
URL de l’audio de pilotage. Lorsqu’il est fourni, le modèle utilise cet audio comme source de pilotage pour générer la vidéo (par exemple synchronisation labiale, synchronisation des mouvements sur le rythme, etc.). S’il n’est pas fourni, le modèle génère automatiquement une musique de fond ou des effets sonores adaptés. Formats pris en charge : wav, mp3 ; durée de 2 à 30 secondes ; taille de fichier ne dépassant pas 15 MB.

Informations de réponse

task_id
string
Utilisez le task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.