Seedance 2.0 Videogenerierung

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

POST

async

seedance-2.0

Seedance 2.0 Videogenerierung

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

Die Modellreihe Seedance 2.0 unterstützt Eingaben in mehreren Modalitäten wie Bild, Video, Audio und Text. Sie bietet Funktionen zur Videogenerierung, Videobearbeitung und Videoverlängerung und kann Objektdetails, Klangfarbe, Effekte, Stil, Kameraführung usw. hochpräzise wiedergeben, während stabile Charaktermerkmale beibehalten werden. Unterstützt werden Text-zu-Video, Bild-zu-Video (erstes Frame / erstes und letztes Frame) sowie Videogenerierung mit multimodalen Referenzen (Kombination aus Bild + Video + Audio). Verfügbar sind die Standardversion (seedance-2.0) und die Schnellversion (seedance-2.0-fast); die Schnellversion ist günstiger und generiert schneller.

Hinweise zum Mindestverbrauch

Anwendbare SKU: Videogenerierung mit multimodalen Referenzen (mit Videoeingabe, d. h. MULTI_REF_VID-Reihe)
Abrechnungsregel: Tatsächliche Belastung = max(Sekundenpreis × gesamte Videodauer in Sekunden, Mindestverbrauch)
Auslösendes Szenario: Wenn das vom Benutzer eingegebene Video sehr kurz ist (z. B. 1–2 Sekunden) und auch die Ausgabe kurz ist, kann der nach Sekunden berechnete Betrag unter den Kosten liegen, die dem Mindest-Tokenverbrauch des Anbieters entsprechen. In diesem Fall greift der Mindestverbrauch als Untergrenze.
Beispielszenario: Ein Kunde möchte ein 4-sekündiges Produktwerbevideo generieren, lädt ein 2-sekündiges Produktwerbevideo hoch und möchte Hintergrund und Farben ändern, ohne weitere Eingabeelemente. Das Video ist relativ einfach. Sekundenpreis × Videodauer ergibt für diesen Vorgang nur $0.19, aber da Videomaterial hochgeladen wurde, wird der Mindestverbrauch ausgelöst und direkt der Mindestverbrauch für die 4-Sekunden-Stufe ($ 0.30) berechnet.

Tabelle zum Mindestverbrauch

Ausgabedauer in Sekunden	2.0-480P	2.0-720P	2.0-1080P	fast-480P	fast-720P
4	$0.30	$0.65	$1.64	$0.23	$0.50
5	$0.39	$0.84	$2.06	$0.30	$0.64
6	$0.43	$0.93	$2.47	$0.33	$0.71
7	$0.52	$1.11	$2.88	$0.40	$0.85
8	$0.61	$1.30	$3.29	$0.46	$1.00
9	$0.65	$1.39	$3.70	$0.50	$1.07
10	$0.73	$1.58	$4.11	$0.56	$1.21
11	$0.82	$1.76	$4.52	$0.63	$1.35
12	$0.86	$1.86	$4.93	$0.66	$1.43
13	$0.95	$2.04	$5.35	$0.73	$1.57
14	$1.04	$2.23	$5.76	$0.79	$1.71
15	$1.08	$2.32	$6.17	$0.83	$1.78

Dies ist eine asynchrone API und gibt nur die task_id der asynchronen Aufgabe zurück. Verwenden Sie diese task_id, um über die API zum Abfragen des Aufgabenergebnisses das generierte Ergebnis abzurufen.

Anfrageheader

Content-Type

string

erforderlich

Enum-Wert: application/json

Authorization

string

erforderlich

Bearer-Authentifizierungsformat: Bearer {{API Key}}.

Anfragetext

fast

boolean

Standard:false

Gibt an, ob das Schnellversionsmodell (seedance-2.0-fast) verwendet wird. Die Schnellversion ist günstiger und generiert schneller.

seed

integer

Zufalls-Seed zur Steuerung der Zufälligkeit des generierten Inhalts. Wertebereich [-1, 2^32-1], -1 bedeutet zufällig.Wertebereich: [-1, +∞]

image

string

URL oder Base64-Codierung des ersten Frames. Wird für den Bild-zu-Video-Modus mit erstem Frame verwendet. Unterstützte Formate: jpeg/png/webp/bmp/tiff/gif. Seitenverhältnisbereich (0.4, 2.5), Pixelbereich für Breite und Höhe (300, 6000), maximal 30 MB pro Bild.

ratio

string

Standard:"adaptive"

Seitenverhältnis des generierten Videos. adaptive bedeutet, dass anhand der Eingabe automatisch das am besten geeignete Seitenverhältnis ausgewählt wird.Optionale Werte: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive

prompt

string

Text-Prompt, der das gewünschte zu generierende Video beschreibt. Chinesisch und Englisch werden unterstützt; empfohlen werden maximal 500 chinesische Zeichen bzw. maximal 1000 englische Wörter. Im Text-zu-Video-Modus erforderlich, in anderen Modi optional.

duration

integer

Standard:5

Dauer des generierten Videos (Sekunden). Bereich [4,15]Wertebereich: [4, 15]

watermark

boolean

Standard:false

Gibt an, ob das generierte Video ein Wasserzeichen enthält.

last_image

string

URL oder Base64-Codierung des letzten Frames. Muss zusammen mit dem Feld image übergeben werden, um den Bild-zu-Video-Modus mit erstem und letztem Frame zu verwenden. Wird last_image ohne image übergeben, ist dies ungültig. Wenn die Seitenverhältnisse von erstem und letztem Frame nicht übereinstimmen, ist das erste Frame maßgeblich; das letzte Frame wird automatisch zugeschnitten und angepasst.

resolution

string

Standard:"720p"

Videoauflösung. 1080p wird nur von der Standardversion unterstützt (fast=false).Optionale Werte: 480p, 720p, 1080p

web_search

boolean

Standard:false

Gibt an, ob die Online-Suche aktiviert wird. Nach Aktivierung entscheidet das Modell anhand des Prompts selbstständig, ob Inhalte im Internet gesucht werden sollen. Dies kann die Aktualität verbessern, erhöht jedoch die Latenz.

generate_audio

boolean

Standard:true

Gibt an, ob synchron zum Bild Ton generiert wird. Bei true erzeugt das Modell basierend auf Text- und visuellen Inhalten automatisch passende Stimmen, Soundeffekte und Hintergrundmusik.

reference_audios

array

Liste von Referenzaudios für den Modus zur Videogenerierung mit multimodalen Referenzen. Jeder Eintrag ist eine Audio-URL oder Base64-Codierung. Formate wav/mp3, einzelne Dauer [2,15]s, Gesamtdauer aller Audios maximal 15s, maximal 15 MB pro Datei. Audio kann nicht allein eingegeben werden; es muss mindestens 1 Referenzbild oder -video enthalten sein.Array-Länge: 1 - 3

reference_images

array

Liste von Referenzbildern für den Modus zur Videogenerierung mit multimodalen Referenzen. Jeder Eintrag ist eine Bild-URL oder Base64-Codierung. Maximal 9 Bilder. Die Art der Bildkombination kann über den Prompt angegeben werden; empfohlen wird das Format „[图1]xxx，[图2]xxx“.Array-Länge: 1 - 9

reference_videos

array

Liste von Referenzvideos für den Modus zur Videogenerierung mit multimodalen Referenzen. Jeder Eintrag ist eine Video-URL. Formate mp4/mov, Auflösung 480p/720p, einzelne Dauer [2,15]s, Gesamtdauer aller Videos maximal 15s, maximal 50 MB pro Datei.Array-Länge: 1 - 3

return_last_frame

boolean

Standard:false

Gibt an, ob das letzte Frame des generierten Videos zurückgegeben wird (png-Format, ohne Wasserzeichen). Kann für die fortlaufende Videogenerierung verwendet werden: Das letzte Frame dient als erstes Frame des nächsten Videosegments.

Antwortinformationen

task_id

string

erforderlich

Verwenden Sie task_id, um über die API zum Abfragen des Aufgabenergebnisses die generierte Ausgabe abzurufen.

Veo 3.1 Fast-Videogenerierung mit erstem und letztem Frame

Zurück

VIDU Q2 Pro Fast Referenzbild/-video zu Video

Weiter

​Hinweise zum Mindestverbrauch

​Tabelle zum Mindestverbrauch

​Anfrageheader

​Anfragetext

​Antwortinformationen

Hinweise zum Mindestverbrauch

Tabelle zum Mindestverbrauch

Anfrageheader

Anfragetext

Antwortinformationen