Wanxiang Wan 2.7 — vidéo générée à partir de références

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-r2v

Wanxiang Wan 2.7 — vidéo générée à partir de références

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

Le modèle Wanxiang Wan 2.7 de vidéo générée à partir de références prend en charge les entrées multimodales (texte/image/vidéo) et peut utiliser une personne ou un objet comme protagoniste pour générer des vidéos de performance à rôle unique ou d’interaction entre plusieurs rôles. Il prend en charge le découpage intelligent en scènes afin de générer des vidéos multi-plans. Les résolutions 720P et 1080P sont prises en charge, avec une durée de 2 à 10 secondes et une facturation à la seconde. La sortie inclut l’audio par défaut.

Il s’agit d’une API asynchrone qui renvoie uniquement le task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer le résultat généré.

En-têtes de requête

Content-Type

string

requis

Valeur d’énumération : application/json

Authorization

string

requis

Format d’authentification Bearer : Bearer {{API Key}}.

Corps de la requête

seed

integer

Graine aléatoire utilisée pour améliorer la reproductibilité des résultats générés. Plage de valeurs [0, 2147483647].Plage de valeurs : [0, 2147483647]

size

string

défaut:"1920*1080"

Résolution de la vidéo de sortie (largeurhauteur), qui influe sur le coût. Gamme 720P : 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Gamme 1080P : 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Valeurs possibles : 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632

audio

boolean

défaut:true

Indique s’il faut générer une vidéo avec son, ce qui influe sur le coût. Par défaut : true (vidéo avec son).

media

array

requis

Tableau de médias de référence, utilisé pour extraire l’apparence du personnage, les mouvements et le timbre vocal. Correspond à character1, character2, etc. dans le prompt selon l’ordre du tableau. Nombre d’images : 0 à 5 ; nombre de vidéos : 0 à 3 ; total maximal : 5. Formats d’image : JPEG, JPG, PNG, BMP, WEBP, résolution [240,8000] pixels, maximum 10 MB. Formats vidéo : MP4, MOV, durée de 1 à 30 secondes, maximum 100 MB. Formats audio : MP3, WAV, FLAC, durée de 3 à 30 secondes.Longueur du tableau : 1 - 5

Masquer properties

url

string

requis

URL du fichier média.

type

string

requis

Type de média. reference_image : image de référence, utilisée pour extraire l’apparence du personnage ; reference_video : vidéo de référence, utilisée pour extraire les mouvements et l’apparence du personnage ; first_frame : image de première frame, permettant de contrôler l’image de départ de la vidéo.Valeurs possibles : reference_image, reference_video, first_frame

reference_voice

string

URL de l’audio de référence du personnage, utilisée pour cloner le timbre vocal du personnage et générer une vidéo avec son. Formats : MP3, WAV, FLAC, durée de 3 à 30 secondes.

prompt

string

requis

Prompt textuel utilisé pour décrire les éléments et caractéristiques visuelles souhaités dans la vidéo générée. Les personnages de référence sont cités via des identifiants tels que character1, character2, etc. Chaque référence (vidéo ou image) ne contient qu’un seul personnage. Le chinois et l’anglais sont pris en charge, avec un maximum de 1500 caractères.Limite de longueur : 0 - 1500

duration

integer

défaut:5

Durée de la vidéo générée, en secondes, facturée à la seconde. Doit être un entier dans la plage [2, 10].Plage de valeurs : [2, 10]

shot_type

string

défaut:"single"

Type de plan. single correspond à un plan unique (par défaut), multi à plusieurs plans. Ce paramètre a une priorité supérieure à celle du prompt.Valeurs possibles : single, multi

watermark

boolean

défaut:false

Indique s’il faut ajouter un filigrane, situé dans l’angle inférieur droit de la vidéo.

negative_prompt

string

Prompt négatif utilisé pour décrire le contenu que vous ne souhaitez pas voir apparaître dans les images de la vidéo. Le chinois et l’anglais sont pris en charge, avec un maximum de 500 caractères.Limite de longueur : 0 - 500

Informations de réponse

task_id

string

Utilisez le task_id pour appeler l’API de consultation du résultat de tâche afin de récupérer la sortie générée.

Wanxiang Wan 2.7 texte vers vidéo

Montage vidéo Wanxiang Wan 2.7

​En-têtes de requête

​Corps de la requête

​Informations de réponse

En-têtes de requête

Corps de la requête

Informations de réponse