Zum Hauptinhalt springen
POST
/
v3
/
async
/
wan2.7-r2v
Wanxiang Wan 2.7 Referenz-zu-Video
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'
{
  "task_id": "<string>"
}
Das Wanxiang Wan 2.7 Referenz-zu-Video-Modell unterstützt multimodale Eingaben (Text/Bild/Video). Es kann Personen oder Objekte als Hauptfiguren verwenden und Videos mit Einzelfiguren-Performances oder Interaktionen mehrerer Figuren generieren. Es unterstützt intelligente Szenenaufteilung und die Generierung von Videos mit mehreren Einstellungen. Unterstützt Auflösungen von 720P und 1080P, eine Dauer von 2 bis 10 Sekunden und wird sekundengenau abgerechnet. Die Ausgabe enthält standardmäßig Audio.
Dies ist eine asynchrone API und gibt nur die task_id der asynchronen Aufgabe zurück. Verwenden Sie diese task_id, um die API zum Abfragen des Aufgabenergebnisses aufzurufen und das generierte Ergebnis abzurufen.

Anfrage-Header

Content-Type
string
erforderlich
Enumerationswert: application/json
Authorization
string
erforderlich
Bearer-Authentifizierungsformat: Bearer {{API Key}}.

Anfragekörper

seed
integer
Zufallszahl-Seed zur Verbesserung der Reproduzierbarkeit der generierten Ergebnisse. Wertebereich [0, 2147483647].Wertebereich: [0, 2147483647]
size
string
Standard:"1920*1080"
Auflösung des Ausgabevideos (BreiteHöhe), beeinflusst die Kosten. 720P-Stufe: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). 1080P-Stufe: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Optionale Werte: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
audio
boolean
Standard:true
Ob ein Video mit Ton generiert werden soll; beeinflusst die Kosten. Standardmäßig true (Video mit Ton).
media
array
erforderlich
Array von Referenzmedien zum Extrahieren von Figurenerscheinung, Bewegungen und Stimmfarbe. Entspricht in der Reihenfolge des Arrays character1, character2 usw. im prompt. Anzahl der Bilder: 0–5, Anzahl der Videos: 0–3, Gesamtanzahl maximal 5. Bildformate: JPEG, JPG, PNG, BMP, WEBP, Auflösung [240,8000] Pixel, maximal 10 MB. Videoformate: MP4, MOV, Dauer 1–30 Sekunden, maximal 100 MB. Audioformate: MP3, WAV, FLAC, Dauer 3–30 Sekunden.Array-Länge: 1 - 5
prompt
string
erforderlich
Text-Prompt zur Beschreibung der gewünschten Elemente und visuellen Merkmale im generierten Video. Referenzfiguren werden über Kennzeichnungen wie character1, character2 usw. referenziert; jede Referenz (Video oder Bild) enthält nur eine einzelne Figur. Unterstützt Chinesisch und Englisch, maximal 1500 Zeichen.Längenbegrenzung: 0 - 1500
duration
integer
Standard:5
Dauer des generierten Videos in Sekunden; sekundengenaue Abrechnung. Ganzzahliger Wertebereich [2, 10].Wertebereich: [2, 10]
shot_type
string
Standard:"single"
Einstellungstyp. single steht für eine einzelne Einstellung (Standard), multi steht für mehrere Einstellungen. Dieser Parameter hat eine höhere Priorität als der prompt.Optionale Werte: single, multi
watermark
boolean
Standard:false
Ob ein Wasserzeichen hinzugefügt werden soll; das Wasserzeichen befindet sich unten rechts im Video.
negative_prompt
string
Negativer Prompt zur Beschreibung von Inhalten, die nicht im Videobild erscheinen sollen. Unterstützt Chinesisch und Englisch, maximal 500 Zeichen.Längenbegrenzung: 0 - 500

Antwortinformationen

task_id
string
Verwenden Sie task_id, um die API zum Abfragen des Aufgabenergebnisses aufzurufen und die generierte Ausgabe abzurufen.