Перейти к основному содержанию
POST
/
v3
/
async
/
seedance-2.0
Генерация видео Seedance 2.0
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'
{
  "task_id": "<string>"
}
Серия моделей Seedance 2.0 поддерживает ввод мультимодального контента, включая изображения, видео, аудио и текст. Модели обладают возможностями генерации видео, редактирования видео, продления видео и т. д.; они могут с высокой точностью восстанавливать детали объектов, тембр, эффекты, стиль, движения камеры и сохранять стабильные характеристики персонажей. Поддерживаются генерация видео из текста, генерация видео из изображения (первый кадр / первый и последний кадры), а также генерация видео по мультимодальным референсам (комбинация изображений + видео + аудио). Доступны стандартная версия (seedance-2.0) и быстрая версия (seedance-2.0-fast); быстрая версия дешевле и генерирует быстрее.

Описание минимального списания

  • Применимые SKU: генерация видео по мультимодальным референсам (с вводом видео, то есть серия MULTI_REF_VID)
  • Правило тарификации: фактическое списание = max(цена за секунду × общая длительность видео в секундах, минимальное списание)
  • Сценарий срабатывания: когда пользователь загружает очень короткое видео (например, 1–2 секунды) и выходное видео также короткое, сумма, рассчитанная посекундно, может оказаться ниже стоимости, соответствующей минимальному расходу token у поставщика; в этом случае применяется минимальное списание
  • Пример сценария: клиент хочет сгенерировать 4-секундный рекламный ролик продукта, загрузил 2-секундное рекламное видео продукта и хочет изменить фон и цвета без других входных элементов. Видео относительно простое, и расчет по формуле цена за секунду × количество секунд видео дает расход всего 0.19,нопосколькубылзагруженвидеоматериал,срабатываетминимальноесписание,иплатавзимаетсянапрямуюпоминимальномусписаниюдля4секундногодиапазона(0.19, но поскольку был загружен видеоматериал, срабатывает минимальное списание, и плата взимается напрямую по минимальному списанию для 4-секундного диапазона (0.30)

Таблица минимального списания

Длительность вывода, сек.2.0-480P2.0-720P2.0-1080Pfast-480Pfast-720P
4$0.30$0.65$1.64$0.23$0.50
5$0.39$0.84$2.06$0.30$0.64
6$0.43$0.93$2.47$0.33$0.71
7$0.52$1.11$2.88$0.40$0.85
8$0.61$1.30$3.29$0.46$1.00
9$0.65$1.39$3.70$0.50$1.07
10$0.73$1.58$4.11$0.56$1.21
11$0.82$1.76$4.52$0.63$1.35
12$0.86$1.86$4.93$0.66$1.43
13$0.95$2.04$5.35$0.73$1.57
14$1.04$2.23$5.76$0.79$1.71
15$1.08$2.32$6.17$0.83$1.78
Это асинхронный API, который возвращает только task_id асинхронной задачи. Используйте этот task_id для запроса API получения результата задачи, чтобы получить результат генерации.

Заголовки запроса

Content-Type
string
обязательно
Перечисляемое значение: application/json
Authorization
string
обязательно
Формат аутентификации Bearer: Bearer {{API 密钥}}.

Тело запроса

fast
boolean
по умолчанию:false
Использовать ли модель быстрой версии (seedance-2.0-fast). Быстрая версия дешевле и генерирует быстрее.
seed
integer
Случайное зерно, используемое для управления случайностью генерируемого контента. Диапазон значений [-1, 2^32-1], -1 означает случайное значение.Диапазон значений: [-1, +∞]
image
string
URL изображения первого кадра или кодировка Base64. Используется в режиме генерации видео из изображения — первый кадр. Поддерживаемые форматы: jpeg/png/webp/bmp/tiff/gif. Диапазон соотношения сторон (0.4, 2.5), диапазон ширины и высоты в пикселях (300, 6000), размер одного изображения не более 30MB.
ratio
string
по умолчанию:"adaptive"
Соотношение сторон генерируемого видео. adaptive означает автоматический выбор наиболее подходящего соотношения сторон на основе входных данных.Допустимые значения: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive
prompt
string
Текстовый промпт, описывающий ожидаемое видео. Поддерживаются китайский и английский языки; рекомендуется не более 500 китайских иероглифов или не более 1000 английских слов. Обязателен в режиме генерации видео из текста, в других режимах — необязателен.
duration
integer
по умолчанию:5
Длительность генерируемого видео (в секундах). Диапазон [4,15]Диапазон значений: [4, 15]
watermark
boolean
по умолчанию:false
Должно ли сгенерированное видео содержать водяной знак.
last_image
string
URL изображения последнего кадра или кодировка Base64. Должно передаваться одновременно с полем image для реализации режима генерации видео из изображения — первый и последний кадры. Передача только last_image без image недействительна. Если соотношение сторон изображений первого и последнего кадра различается, основным считается первый кадр, а последний кадр автоматически обрезается и адаптируется.
resolution
string
по умолчанию:"720p"
Разрешение видео. 1080p поддерживается только стандартной версией (fast=false).Допустимые значения: 480p, 720p, 1080p
Включать ли интернет-поиск. После включения модель самостоятельно определяет по промпту, нужно ли искать контент в интернете; это может повысить актуальность, но увеличивает задержку.
generate_audio
boolean
по умолчанию:true
Генерировать ли звук, синхронизированный с изображением. При true модель автоматически генерирует подходящую речь, звуковые эффекты и фоновую музыку на основе текста и визуального контента.
reference_audios
array
Список референсных аудио для режима генерации видео по мультимодальным референсам. Каждый элемент — URL аудио или кодировка Base64. Формат wav/mp3, длительность одного аудио [2,15]s, суммарная длительность всех аудио не более 15s, размер одного аудио не более 15MB. Нельзя передавать только аудио; необходимо включить как минимум 1 референсное изображение или видео.Длина массива: 1 - 3
reference_images
array
Список референсных изображений для режима генерации видео по мультимодальным референсам. Каждый элемент — URL изображения или кодировка Base64. Максимум 9 изображений. Способ комбинирования изображений можно указать через промпт; рекомендуется использовать формат «[图1]xxx,[图2]xxx».Длина массива: 1 - 9
reference_videos
array
Список референсных видео для режима генерации видео по мультимодальным референсам. Каждый элемент — URL видео. Формат mp4/mov, разрешение 480p/720p, длительность одного видео [2,15]s, суммарная длительность всех видео не более 15s, размер одного видео не более 50MB.Длина массива: 1 - 3
return_last_frame
boolean
по умолчанию:false
Возвращать ли изображение последнего кадра сгенерированного видео (формат png, без водяного знака). Можно использовать для непрерывной генерации видео: использовать последний кадр как первый кадр следующего сегмента видео.

Информация об ответе

task_id
string
обязательно
Используйте task_id для запроса API получения результата задачи, чтобы получить сгенерированный вывод.