Wanxiang Wan 2.7 Referenz-zu-Video

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-r2v

Wanxiang Wan 2.7 Referenz-zu-Video

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

Das Wanxiang Wan 2.7 Referenz-zu-Video-Modell unterstützt multimodale Eingaben (Text/Bild/Video). Es kann Personen oder Objekte als Hauptfiguren verwenden und Videos mit Einzelfiguren-Performances oder Interaktionen mehrerer Figuren generieren. Es unterstützt intelligente Szenenaufteilung und die Generierung von Videos mit mehreren Einstellungen. Unterstützt Auflösungen von 720P und 1080P, eine Dauer von 2 bis 10 Sekunden und wird sekundengenau abgerechnet. Die Ausgabe enthält standardmäßig Audio.

Dies ist eine asynchrone API und gibt nur die task_id der asynchronen Aufgabe zurück. Verwenden Sie diese task_id, um die API zum Abfragen des Aufgabenergebnisses aufzurufen und das generierte Ergebnis abzurufen.

Anfrage-Header

Content-Type

string

erforderlich

Enumerationswert: application/json

Authorization

string

erforderlich

Bearer-Authentifizierungsformat: Bearer {{API Key}}.

Anfragekörper

seed

integer

Zufallszahl-Seed zur Verbesserung der Reproduzierbarkeit der generierten Ergebnisse. Wertebereich [0, 2147483647].Wertebereich: [0, 2147483647]

size

string

Standard:"1920*1080"

Auflösung des Ausgabevideos (BreiteHöhe), beeinflusst die Kosten. 720P-Stufe: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). 1080P-Stufe: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Optionale Werte: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632

audio

boolean

Standard:true

Ob ein Video mit Ton generiert werden soll; beeinflusst die Kosten. Standardmäßig true (Video mit Ton).

media

array

erforderlich

Array von Referenzmedien zum Extrahieren von Figurenerscheinung, Bewegungen und Stimmfarbe. Entspricht in der Reihenfolge des Arrays character1, character2 usw. im prompt. Anzahl der Bilder: 0–5, Anzahl der Videos: 0–3, Gesamtanzahl maximal 5. Bildformate: JPEG, JPG, PNG, BMP, WEBP, Auflösung [240,8000] Pixel, maximal 10 MB. Videoformate: MP4, MOV, Dauer 1–30 Sekunden, maximal 100 MB. Audioformate: MP3, WAV, FLAC, Dauer 3–30 Sekunden.Array-Länge: 1 - 5

Ausblenden properties

url

string

erforderlich

URL der Mediendatei.

type

string

erforderlich

Medientyp. reference_image: Referenzbild zum Extrahieren der Figurenerscheinung; reference_video: Referenzvideo zum Extrahieren von Bewegungen und Erscheinung der Figur; first_frame: Erstes Frame-Bild zur Steuerung des Startbilds des Videos.Optionale Werte: reference_image, reference_video, first_frame

reference_voice

string

URL des Referenzaudios der Figur, zum Klonen der Stimmfarbe der Figur und Generieren eines Videos mit Ton. Format: MP3, WAV, FLAC, Dauer 3–30 Sekunden.

prompt

string

erforderlich

Text-Prompt zur Beschreibung der gewünschten Elemente und visuellen Merkmale im generierten Video. Referenzfiguren werden über Kennzeichnungen wie character1, character2 usw. referenziert; jede Referenz (Video oder Bild) enthält nur eine einzelne Figur. Unterstützt Chinesisch und Englisch, maximal 1500 Zeichen.Längenbegrenzung: 0 - 1500

duration

integer

Standard:5

Dauer des generierten Videos in Sekunden; sekundengenaue Abrechnung. Ganzzahliger Wertebereich [2, 10].Wertebereich: [2, 10]

shot_type

string

Standard:"single"

Einstellungstyp. single steht für eine einzelne Einstellung (Standard), multi steht für mehrere Einstellungen. Dieser Parameter hat eine höhere Priorität als der prompt.Optionale Werte: single, multi

watermark

boolean

Standard:false

Ob ein Wasserzeichen hinzugefügt werden soll; das Wasserzeichen befindet sich unten rechts im Video.

negative_prompt

string

Negativer Prompt zur Beschreibung von Inhalten, die nicht im Videobild erscheinen sollen. Unterstützt Chinesisch und Englisch, maximal 500 Zeichen.Längenbegrenzung: 0 - 500

Antwortinformationen

task_id

string

Verwenden Sie task_id, um die API zum Abfragen des Aufgabenergebnisses aufzurufen und die generierte Ausgabe abzurufen.

Wanxiang Wan 2.7 Text-zu-Video

Zurück

Wanxiang Wan 2.7 Videobearbeitung

Weiter

​Anfrage-Header

​Anfragekörper

​Antwortinformationen

Anfrage-Header

Anfragekörper

Antwortinformationen