Passer au contenu principal
POST
/
v3
/
async
/
wan2.7-t2v
Wanxiang Wan 2.7 texte vers vidéo
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-t2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "audio_url": "<string>",
  "watermark": true,
  "prompt_extend": true,
  "negative_prompt": "<string>"
}
'
{
  "task_id": "<string>"
}
Modèle Wanxiang Wan 2.7 texte vers vidéo, générant des vidéos fluides à partir de prompts textuels. Prend en charge le pilotage audio ou le doublage automatique, les résolutions 720P et 1080P, une durée de 2 à 15 secondes, avec facturation à la seconde. La sortie inclut l’audio par défaut.
Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

Content-Type
string
requis
Valeur d’énumération : application/json
Authorization
string
requis
Format d’authentification Bearer : Bearer {{clé API}}.

Corps de la requête

seed
integer
Graine de nombre aléatoire, utilisée pour améliorer la reproductibilité des résultats générés. Plage de valeurs [0, 2147483647].Plage de valeurs : [0, 2147483647]
size
string
défaut:"1920*1080"
Résolution de la vidéo de sortie (largeurhauteur), affectant le coût. Niveau 720P : 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Niveau 1080P : 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valeurs possibles : 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
prompt
string
requis
Prompt textuel utilisé pour décrire les éléments et caractéristiques visuelles souhaités dans la vidéo générée. Prend en charge le chinois et l’anglais, jusqu’à 1500 caractères ; la partie excédentaire est automatiquement tronquée.Limite de longueur : 0 - 1500
duration
integer
défaut:5
Durée de la vidéo générée, en secondes, facturée à la seconde. Entier dans la plage [2, 15].Plage de valeurs : [2, 15]
audio_url
string
URL du fichier audio ; le modèle utilisera cet audio pour piloter la génération vidéo (par exemple synchronisation labiale, calage des mouvements sur le rythme, etc.). Si elle n’est pas fournie, le modèle génère automatiquement une musique de fond ou des effets sonores correspondants. Formats pris en charge : wav, mp3 ; durée de 3 à 30 secondes, fichier de 15 MB maximum. Si l’audio dépasse la durée de la vidéo, il est tronqué ; s’il est plus court, la partie restante est silencieuse.
watermark
boolean
défaut:false
Indique s’il faut ajouter un filigrane, situé dans le coin inférieur droit de la vidéo.
prompt_extend
boolean
défaut:true
Indique s’il faut activer la réécriture intelligente du prompt. Une fois activée, un grand modèle est utilisé pour réécrire intelligemment le prompt saisi ; l’amélioration de l’effet de génération est notable pour les prompts courts, mais cela augmente le temps de traitement.
negative_prompt
string
Prompt négatif, utilisé pour décrire le contenu que vous ne souhaitez pas voir apparaître dans les images de la vidéo. Prend en charge le chinois et l’anglais, jusqu’à 500 caractères.Limite de longueur : 0 - 500

Informations de réponse

task_id
string
Utilisez le task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.