Wanxiang Wan 2.7 image vers vidéo

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "prompt": "<string>",
  "duration": 123,
  "image_url": "<string>",
  "watermark": true,
  "resolution": "<string>",
  "prompt_extend": true,
  "first_clip_url": "<string>",
  "last_frame_url": "<string>",
  "negative_prompt": "<string>",
  "driving_audio_url": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-i2v

Wanxiang Wan 2.7 image vers vidéo

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-i2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "prompt": "<string>",
  "duration": 123,
  "image_url": "<string>",
  "watermark": true,
  "resolution": "<string>",
  "prompt_extend": true,
  "first_clip_url": "<string>",
  "last_frame_url": "<string>",
  "negative_prompt": "<string>",
  "driving_audio_url": "<string>"
}
'

{
  "task_id": "<string>"
}

Le modèle Wanxiang Wan 2.7 image vers vidéo prend en charge les entrées multimodales (texte/image/audio/vidéo) et peut réaliser trois types de tâches : génération de vidéo à partir d’une première image, génération de vidéo à partir d’une image de début et de fin, et prolongation de vidéo. Il prend en charge les résolutions 720P et 1080P, une durée de 2 à 15 secondes, avec une facturation à la seconde. La sortie inclut l’audio par défaut.

Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

Content-Type

string

requis

Valeurs énumérées : application/json

Authorization

string

requis

Format d’authentification Bearer : Bearer {{clé API}}.

Corps de la requête

seed

integer

Graine aléatoire, utilisée pour améliorer la reproductibilité des résultats générés. Plage de valeurs [0, 2147483647].Plage de valeurs : [0, 2147483647]

prompt

string

Prompt textuel utilisé pour décrire les éléments et caractéristiques visuelles souhaités dans la vidéo générée. Le chinois et l’anglais sont pris en charge, avec un maximum de 5000 caractères.Limite de longueur : 0 - 5000

duration

integer

défaut:5

Durée de la vidéo générée, en secondes, facturée à la seconde. Entier dans la plage [2, 15].Plage de valeurs : [2, 15]

image_url

string

requis

URL de l’image de première image. Formats pris en charge : JPEG, JPG, PNG (canal transparent non pris en charge), BMP, WEBP. Largeur et hauteur de résolution dans la plage [240, 8000] pixels, rapport largeur/hauteur de 1:8 à 8:1, taille de fichier ne dépassant pas 20 MB. À choisir avec first_clip_url ; au moins l’un des deux doit être fourni.

watermark

boolean

défaut:false

Indique s’il faut ajouter un filigrane ; le filigrane est placé dans le coin inférieur droit de la vidéo.

resolution

string

défaut:"1080P"

Niveau de résolution de la vidéo de sortie, qui affecte le coût. Le rapport largeur/hauteur de la vidéo reste identique à celui du contenu d’entrée.Valeurs possibles : 720P, 1080P

prompt_extend

boolean

défaut:true

Indique s’il faut activer la réécriture intelligente du prompt. Une fois activée, un grand modèle est utilisé pour réécrire intelligemment le prompt d’entrée, ce qui améliore nettement les résultats pour les prompts courts, mais augmente le temps de traitement.

first_clip_url

string

URL du premier segment vidéo, utilisée pour la prolongation de vidéo. Le modèle générera la suite à partir du contenu de cette vidéo. Formats pris en charge : mp4, mov ; durée de 2 à 10 secondes ; largeur et hauteur de résolution dans la plage [240, 4096] pixels ; rapport largeur/hauteur de 1:8 à 8:1 ; taille de fichier ne dépassant pas 100 MB. À choisir avec image_url.

last_frame_url

string

URL de l’image de fin. Associée à la première image, elle permet de générer une vidéo avec image de début et de fin. Les restrictions de format sont identiques à celles de la première image.

negative_prompt

string

Prompt négatif utilisé pour décrire le contenu que vous ne souhaitez pas voir apparaître dans les images de la vidéo. Le chinois et l’anglais sont pris en charge, avec un maximum de 500 caractères.Limite de longueur : 0 - 500

driving_audio_url

string

URL de l’audio de pilotage. Lorsqu’il est fourni, le modèle utilise cet audio comme source de pilotage pour générer la vidéo (par exemple synchronisation labiale, synchronisation des mouvements sur le rythme, etc.). S’il n’est pas fourni, le modèle génère automatiquement une musique de fond ou des effets sonores adaptés. Formats pris en charge : wav, mp3 ; durée de 2 à 30 secondes ; taille de fichier ne dépassant pas 15 MB.

Informations de réponse

task_id

string

Utilisez le task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.

PixVerse C1 image de début et de fin vers vidéo

Wanxiang Wan 2.7 texte vers vidéo

​En-têtes de requête

​Corps de la requête

​Informations de réponse

En-têtes de requête

Corps de la requête

Informations de réponse