Генерация видео Seedance 2.0
Видео
Генерация видео Seedance 2.0
POST
Генерация видео Seedance 2.0
Серия моделей Seedance 2.0 поддерживает ввод мультимодального контента, включая изображения, видео, аудио и текст. Модели обладают возможностями генерации видео, редактирования видео, продления видео и т. д.; они могут с высокой точностью восстанавливать детали объектов, тембр, эффекты, стиль, движения камеры и сохранять стабильные характеристики персонажей. Поддерживаются генерация видео из текста, генерация видео из изображения (первый кадр / первый и последний кадры), а также генерация видео по мультимодальным референсам (комбинация изображений + видео + аудио). Доступны стандартная версия (seedance-2.0) и быстрая версия (seedance-2.0-fast); быстрая версия дешевле и генерирует быстрее.
Описание минимального списания
- Применимые SKU: генерация видео по мультимодальным референсам (с вводом видео, то есть серия MULTI_REF_VID)
- Правило тарификации: фактическое списание = max(цена за секунду × общая длительность видео в секундах, минимальное списание)
- Сценарий срабатывания: когда пользователь загружает очень короткое видео (например, 1–2 секунды) и выходное видео также короткое, сумма, рассчитанная посекундно, может оказаться ниже стоимости, соответствующей минимальному расходу token у поставщика; в этом случае применяется минимальное списание
- Пример сценария: клиент хочет сгенерировать 4-секундный рекламный ролик продукта, загрузил 2-секундное рекламное видео продукта и хочет изменить фон и цвета без других входных элементов. Видео относительно простое, и расчет по формуле цена за секунду × количество секунд видео дает расход всего 0.30)
Таблица минимального списания
| Длительность вывода, сек. | 2.0-480P | 2.0-720P | 2.0-1080P | fast-480P | fast-720P |
|---|---|---|---|---|---|
| 4 | $0.30 | $0.65 | $1.64 | $0.23 | $0.50 |
| 5 | $0.39 | $0.84 | $2.06 | $0.30 | $0.64 |
| 6 | $0.43 | $0.93 | $2.47 | $0.33 | $0.71 |
| 7 | $0.52 | $1.11 | $2.88 | $0.40 | $0.85 |
| 8 | $0.61 | $1.30 | $3.29 | $0.46 | $1.00 |
| 9 | $0.65 | $1.39 | $3.70 | $0.50 | $1.07 |
| 10 | $0.73 | $1.58 | $4.11 | $0.56 | $1.21 |
| 11 | $0.82 | $1.76 | $4.52 | $0.63 | $1.35 |
| 12 | $0.86 | $1.86 | $4.93 | $0.66 | $1.43 |
| 13 | $0.95 | $2.04 | $5.35 | $0.73 | $1.57 |
| 14 | $1.04 | $2.23 | $5.76 | $0.79 | $1.71 |
| 15 | $1.08 | $2.32 | $6.17 | $0.83 | $1.78 |
Заголовки запроса
Перечисляемое значение:
application/jsonФормат аутентификации Bearer: Bearer {{API 密钥}}.
Тело запроса
Использовать ли модель быстрой версии (seedance-2.0-fast). Быстрая версия дешевле и генерирует быстрее.
Случайное зерно, используемое для управления случайностью генерируемого контента. Диапазон значений [-1, 2^32-1], -1 означает случайное значение.Диапазон значений: [-1, +∞]
URL изображения первого кадра или кодировка Base64. Используется в режиме генерации видео из изображения — первый кадр. Поддерживаемые форматы: jpeg/png/webp/bmp/tiff/gif. Диапазон соотношения сторон (0.4, 2.5), диапазон ширины и высоты в пикселях (300, 6000), размер одного изображения не более 30MB.
Соотношение сторон генерируемого видео. adaptive означает автоматический выбор наиболее подходящего соотношения сторон на основе входных данных.Допустимые значения:
16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptiveТекстовый промпт, описывающий ожидаемое видео. Поддерживаются китайский и английский языки; рекомендуется не более 500 китайских иероглифов или не более 1000 английских слов. Обязателен в режиме генерации видео из текста, в других режимах — необязателен.
Длительность генерируемого видео (в секундах). Диапазон [4,15]Диапазон значений: [4, 15]
Должно ли сгенерированное видео содержать водяной знак.
URL изображения последнего кадра или кодировка Base64. Должно передаваться одновременно с полем image для реализации режима генерации видео из изображения — первый и последний кадры. Передача только last_image без image недействительна. Если соотношение сторон изображений первого и последнего кадра различается, основным считается первый кадр, а последний кадр автоматически обрезается и адаптируется.
Разрешение видео. 1080p поддерживается только стандартной версией (fast=false).Допустимые значения:
480p, 720p, 1080pВключать ли интернет-поиск. После включения модель самостоятельно определяет по промпту, нужно ли искать контент в интернете; это может повысить актуальность, но увеличивает задержку.
Генерировать ли звук, синхронизированный с изображением. При true модель автоматически генерирует подходящую речь, звуковые эффекты и фоновую музыку на основе текста и визуального контента.
Список референсных аудио для режима генерации видео по мультимодальным референсам. Каждый элемент — URL аудио или кодировка Base64. Формат wav/mp3, длительность одного аудио [2,15]s, суммарная длительность всех аудио не более 15s, размер одного аудио не более 15MB. Нельзя передавать только аудио; необходимо включить как минимум 1 референсное изображение или видео.Длина массива: 1 - 3
Список референсных изображений для режима генерации видео по мультимодальным референсам. Каждый элемент — URL изображения или кодировка Base64. Максимум 9 изображений. Способ комбинирования изображений можно указать через промпт; рекомендуется использовать формат «[图1]xxx,[图2]xxx».Длина массива: 1 - 9
Список референсных видео для режима генерации видео по мультимодальным референсам. Каждый элемент — URL видео. Формат mp4/mov, разрешение 480p/720p, длительность одного видео [2,15]s, суммарная длительность всех видео не более 15s, размер одного видео не более 50MB.Длина массива: 1 - 3
Возвращать ли изображение последнего кадра сгенерированного видео (формат png, без водяного знака). Можно использовать для непрерывной генерации видео: использовать последний кадр как первый кадр следующего сегмента видео.
Информация об ответе
Используйте task_id для запроса API получения результата задачи, чтобы получить сгенерированный вывод.