Zum Hauptinhalt springen
POST
/
v3
/
async
/
seedance-2.0
Seedance 2.0 Videogenerierung
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'
{
  "task_id": "<string>"
}
Die Modellreihe Seedance 2.0 unterstützt Eingaben in mehreren Modalitäten wie Bild, Video, Audio und Text. Sie bietet Funktionen zur Videogenerierung, Videobearbeitung und Videoverlängerung und kann Objektdetails, Klangfarbe, Effekte, Stil, Kameraführung usw. hochpräzise wiedergeben, während stabile Charaktermerkmale beibehalten werden. Unterstützt werden Text-zu-Video, Bild-zu-Video (erstes Frame / erstes und letztes Frame) sowie Videogenerierung mit multimodalen Referenzen (Kombination aus Bild + Video + Audio). Verfügbar sind die Standardversion (seedance-2.0) und die Schnellversion (seedance-2.0-fast); die Schnellversion ist günstiger und generiert schneller.

Hinweise zum Mindestverbrauch

  • Anwendbare SKU: Videogenerierung mit multimodalen Referenzen (mit Videoeingabe, d. h. MULTI_REF_VID-Reihe)
  • Abrechnungsregel: Tatsächliche Belastung = max(Sekundenpreis × gesamte Videodauer in Sekunden, Mindestverbrauch)
  • Auslösendes Szenario: Wenn das vom Benutzer eingegebene Video sehr kurz ist (z. B. 1–2 Sekunden) und auch die Ausgabe kurz ist, kann der nach Sekunden berechnete Betrag unter den Kosten liegen, die dem Mindest-Tokenverbrauch des Anbieters entsprechen. In diesem Fall greift der Mindestverbrauch als Untergrenze.
  • Beispielszenario: Ein Kunde möchte ein 4-sekündiges Produktwerbevideo generieren, lädt ein 2-sekündiges Produktwerbevideo hoch und möchte Hintergrund und Farben ändern, ohne weitere Eingabeelemente. Das Video ist relativ einfach. Sekundenpreis × Videodauer ergibt für diesen Vorgang nur 0.19,aberdaVideomaterialhochgeladenwurde,wirdderMindestverbrauchausgelo¨stunddirektderMindestverbrauchfu¨rdie4SekundenStufe(0.19, aber da Videomaterial hochgeladen wurde, wird der Mindestverbrauch ausgelöst und direkt der Mindestverbrauch für die 4-Sekunden-Stufe (0.30) berechnet.

Tabelle zum Mindestverbrauch

Ausgabedauer in Sekunden2.0-480P2.0-720P2.0-1080Pfast-480Pfast-720P
4$0.30$0.65$1.64$0.23$0.50
5$0.39$0.84$2.06$0.30$0.64
6$0.43$0.93$2.47$0.33$0.71
7$0.52$1.11$2.88$0.40$0.85
8$0.61$1.30$3.29$0.46$1.00
9$0.65$1.39$3.70$0.50$1.07
10$0.73$1.58$4.11$0.56$1.21
11$0.82$1.76$4.52$0.63$1.35
12$0.86$1.86$4.93$0.66$1.43
13$0.95$2.04$5.35$0.73$1.57
14$1.04$2.23$5.76$0.79$1.71
15$1.08$2.32$6.17$0.83$1.78
Dies ist eine asynchrone API und gibt nur die task_id der asynchronen Aufgabe zurück. Verwenden Sie diese task_id, um über die API zum Abfragen des Aufgabenergebnisses das generierte Ergebnis abzurufen.

Anfrageheader

Content-Type
string
erforderlich
Enum-Wert: application/json
Authorization
string
erforderlich
Bearer-Authentifizierungsformat: Bearer {{API Key}}.

Anfragetext

fast
boolean
Standard:false
Gibt an, ob das Schnellversionsmodell (seedance-2.0-fast) verwendet wird. Die Schnellversion ist günstiger und generiert schneller.
seed
integer
Zufalls-Seed zur Steuerung der Zufälligkeit des generierten Inhalts. Wertebereich [-1, 2^32-1], -1 bedeutet zufällig.Wertebereich: [-1, +∞]
image
string
URL oder Base64-Codierung des ersten Frames. Wird für den Bild-zu-Video-Modus mit erstem Frame verwendet. Unterstützte Formate: jpeg/png/webp/bmp/tiff/gif. Seitenverhältnisbereich (0.4, 2.5), Pixelbereich für Breite und Höhe (300, 6000), maximal 30 MB pro Bild.
ratio
string
Standard:"adaptive"
Seitenverhältnis des generierten Videos. adaptive bedeutet, dass anhand der Eingabe automatisch das am besten geeignete Seitenverhältnis ausgewählt wird.Optionale Werte: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive
prompt
string
Text-Prompt, der das gewünschte zu generierende Video beschreibt. Chinesisch und Englisch werden unterstützt; empfohlen werden maximal 500 chinesische Zeichen bzw. maximal 1000 englische Wörter. Im Text-zu-Video-Modus erforderlich, in anderen Modi optional.
duration
integer
Standard:5
Dauer des generierten Videos (Sekunden). Bereich [4,15]Wertebereich: [4, 15]
watermark
boolean
Standard:false
Gibt an, ob das generierte Video ein Wasserzeichen enthält.
last_image
string
URL oder Base64-Codierung des letzten Frames. Muss zusammen mit dem Feld image übergeben werden, um den Bild-zu-Video-Modus mit erstem und letztem Frame zu verwenden. Wird last_image ohne image übergeben, ist dies ungültig. Wenn die Seitenverhältnisse von erstem und letztem Frame nicht übereinstimmen, ist das erste Frame maßgeblich; das letzte Frame wird automatisch zugeschnitten und angepasst.
resolution
string
Standard:"720p"
Videoauflösung. 1080p wird nur von der Standardversion unterstützt (fast=false).Optionale Werte: 480p, 720p, 1080p
Gibt an, ob die Online-Suche aktiviert wird. Nach Aktivierung entscheidet das Modell anhand des Prompts selbstständig, ob Inhalte im Internet gesucht werden sollen. Dies kann die Aktualität verbessern, erhöht jedoch die Latenz.
generate_audio
boolean
Standard:true
Gibt an, ob synchron zum Bild Ton generiert wird. Bei true erzeugt das Modell basierend auf Text- und visuellen Inhalten automatisch passende Stimmen, Soundeffekte und Hintergrundmusik.
reference_audios
array
Liste von Referenzaudios für den Modus zur Videogenerierung mit multimodalen Referenzen. Jeder Eintrag ist eine Audio-URL oder Base64-Codierung. Formate wav/mp3, einzelne Dauer [2,15]s, Gesamtdauer aller Audios maximal 15s, maximal 15 MB pro Datei. Audio kann nicht allein eingegeben werden; es muss mindestens 1 Referenzbild oder -video enthalten sein.Array-Länge: 1 - 3
reference_images
array
Liste von Referenzbildern für den Modus zur Videogenerierung mit multimodalen Referenzen. Jeder Eintrag ist eine Bild-URL oder Base64-Codierung. Maximal 9 Bilder. Die Art der Bildkombination kann über den Prompt angegeben werden; empfohlen wird das Format „[图1]xxx,[图2]xxx“.Array-Länge: 1 - 9
reference_videos
array
Liste von Referenzvideos für den Modus zur Videogenerierung mit multimodalen Referenzen. Jeder Eintrag ist eine Video-URL. Formate mp4/mov, Auflösung 480p/720p, einzelne Dauer [2,15]s, Gesamtdauer aller Videos maximal 15s, maximal 50 MB pro Datei.Array-Länge: 1 - 3
return_last_frame
boolean
Standard:false
Gibt an, ob das letzte Frame des generierten Videos zurückgegeben wird (png-Format, ohne Wasserzeichen). Kann für die fortlaufende Videogenerierung verwendet werden: Das letzte Frame dient als erstes Frame des nächsten Videosegments.

Antwortinformationen

task_id
string
erforderlich
Verwenden Sie task_id, um über die API zum Abfragen des Aufgabenergebnisses die generierte Ausgabe abzurufen.