Seedance 2.0 動画生成
動画
Seedance 2.0 動画生成
POST
Seedance 2.0 動画生成
Seedance 2.0 シリーズモデルは、画像、動画、音声、テキストなど複数モダリティのコンテンツ入力に対応し、動画生成、動画編集、動画延長などの機能を備えています。物体のディテール、音色、効果、スタイル、カメラワークなどを高精度に再現し、安定したキャラクター特徴を維持できます。テキストから動画生成、画像から動画生成(先頭フレーム/先頭・末尾フレーム)、マルチモーダル参照から動画生成(画像+動画+音声の組み合わせ)に対応しています。標準版(seedance-2.0)と高速版(seedance-2.0-fast)を提供しており、高速版は価格が低く、生成速度がより速くなります。
最低消費額について
- 適用 SKU:マルチモーダル参照から動画生成(動画入力を含む、つまり MULTI_REF_VID シリーズ)
- 課金ルール:実際の課金額 = max(秒単価 × 総動画秒数, 最低消費額)
- トリガーされるケース:ユーザーが入力した動画が非常に短く(例:1〜2 秒)、出力も短い場合、秒単位で計算した金額がサプライヤーの最低 token 消費に対応する費用を下回る可能性があります。この場合、最低消費額が下限として適用されます
- シナリオ例:顧客が4秒の製品プロモーション動画を生成したいとします。2秒の製品プロモーション動画をアップロードし、背景と色を変更したいが、他の入力要素はなく、動画も比較的シンプルです。秒単価 × 動画秒数で計算すると今回の消費額はわずか0.30)で直接課金されます
最低消費額表
| 出力秒数 | 2.0-480P | 2.0-720P | 2.0-1080P | fast-480P | fast-720P |
|---|---|---|---|---|---|
| 4 | $0.30 | $0.65 | $1.64 | $0.23 | $0.50 |
| 5 | $0.39 | $0.84 | $2.06 | $0.30 | $0.64 |
| 6 | $0.43 | $0.93 | $2.47 | $0.33 | $0.71 |
| 7 | $0.52 | $1.11 | $2.88 | $0.40 | $0.85 |
| 8 | $0.61 | $1.30 | $3.29 | $0.46 | $1.00 |
| 9 | $0.65 | $1.39 | $3.70 | $0.50 | $1.07 |
| 10 | $0.73 | $1.58 | $4.11 | $0.56 | $1.21 |
| 11 | $0.82 | $1.76 | $4.52 | $0.63 | $1.35 |
| 12 | $0.86 | $1.86 | $4.93 | $0.66 | $1.43 |
| 13 | $0.95 | $2.04 | $5.35 | $0.73 | $1.57 |
| 14 | $1.04 | $2.23 | $5.76 | $0.79 | $1.71 |
| 15 | $1.08 | $2.32 | $6.17 | $0.83 | $1.78 |
リクエストヘッダー
列挙値:
application/jsonBearer 認証形式: Bearer {{API Key}}。
リクエストボディ
高速版モデル(seedance-2.0-fast)を使用するかどうか。高速版は価格が低く、生成速度がより速くなります。
ランダムシード。生成内容のランダム性を制御するために使用します。値の範囲は [-1, 2^32-1] で、-1 はランダムを意味します。値の範囲:[-1, +∞]
先頭フレーム画像の URL または Base64 エンコード。画像から動画生成-先頭フレームモードで使用します。形式は jpeg/png/webp/bmp/tiff/gif に対応しています。アスペクト比の範囲は (0.4, 2.5)、ピクセルの幅・高さの範囲は (300, 6000)、1枚あたり 30MB 以下です。
生成動画のアスペクト比。adaptive は入力に基づいて最適なアスペクト比を自動選択することを示します。選択可能な値:
16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptiveテキストプロンプト。生成したい動画を記述します。中国語と英語に対応しており、中国語は500字以内、英語は1000語以内を推奨します。テキストから動画生成モードでは必須、その他のモードでは任意です。
生成動画の長さ(秒)。範囲 [4,15]値の範囲:[4, 15]
生成動画に透かしを含めるかどうか。
末尾フレーム画像の URL または Base64 エンコード。image フィールドと同時に渡す必要があり、画像から動画生成-先頭・末尾フレームモードを実現します。last_image のみを渡して image を渡さない場合は無効です。先頭・末尾フレーム画像のアスペクト比が一致しない場合は、先頭フレームを基準とし、末尾フレームは自動的にクロップされて適合されます。
動画解像度。1080p は標準版(fast=false)のみ対応しています。選択可能な値:
480p, 720p, 1080pWeb検索を有効にするかどうか。有効にすると、モデルはプロンプトに基づいてインターネット上のコンテンツを検索するかを自律的に判断します。即時性を向上できますが、遅延が増加します。
映像と同期した音声を生成するかどうか。true の場合、モデルはテキストと視覚コンテンツに基づき、マッチする人声、効果音、背景音楽を自動生成します。
参照音声リスト。マルチモーダル参照から動画生成モードで使用します。各項目は音声 URL または Base64 エンコードです。形式は wav/mp3、単一の長さは [2,15]s、すべての音声の合計長は 15s 以下、単一ファイルは 15MB 以下です。音声のみを単独で入力することはできず、少なくとも 1 つの参照画像または動画を含める必要があります。配列長:1 - 3
参照画像リスト。マルチモーダル参照から動画生成モードで使用します。各項目は画像 URL または Base64 エンコードです。最大 9 枚まで。プロンプトで画像の組み合わせ方法を指定でき、「[図1]xxx,[図2]xxx」形式の使用を推奨します。配列長:1 - 9
参照動画リスト。マルチモーダル参照から動画生成モードで使用します。各項目は動画 URL です。形式は mp4/mov、解像度は 480p/720p、単一の長さは [2,15]s、すべての動画の合計長は 15s 以下、単一ファイルは 50MB 以下です。配列長:1 - 3
生成動画の末尾フレーム画像(png形式、透かしなし)を返すかどうか。連続動画生成に使用できます:末尾フレームを次の動画セグメントの先頭フレームとして使用します。
レスポンス情報
task_id を使用して タスク結果取得 API にリクエストし、生成された出力を取得します。