Генерация видео Seedance 2.0

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

POST

async

seedance-2.0

Генерация видео Seedance 2.0

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/seedance-2.0 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "fast": true,
  "seed": 123,
  "image": "<string>",
  "ratio": "<string>",
  "prompt": "<string>",
  "duration": 123,
  "watermark": true,
  "last_image": "<string>",
  "resolution": "<string>",
  "web_search": true,
  "generate_audio": true,
  "reference_audios": [
    {}
  ],
  "reference_images": [
    {}
  ],
  "reference_videos": [
    {}
  ],
  "return_last_frame": true
}
'

{
  "task_id": "<string>"
}

Серия моделей Seedance 2.0 поддерживает ввод мультимодального контента, включая изображения, видео, аудио и текст. Модели обладают возможностями генерации видео, редактирования видео, продления видео и т. д.; они могут с высокой точностью восстанавливать детали объектов, тембр, эффекты, стиль, движения камеры и сохранять стабильные характеристики персонажей. Поддерживаются генерация видео из текста, генерация видео из изображения (первый кадр / первый и последний кадры), а также генерация видео по мультимодальным референсам (комбинация изображений + видео + аудио). Доступны стандартная версия (seedance-2.0) и быстрая версия (seedance-2.0-fast); быстрая версия дешевле и генерирует быстрее.

Описание минимального списания

Применимые SKU: генерация видео по мультимодальным референсам (с вводом видео, то есть серия MULTI_REF_VID)
Правило тарификации: фактическое списание = max(цена за секунду × общая длительность видео в секундах, минимальное списание)
Сценарий срабатывания: когда пользователь загружает очень короткое видео (например, 1–2 секунды) и выходное видео также короткое, сумма, рассчитанная посекундно, может оказаться ниже стоимости, соответствующей минимальному расходу token у поставщика; в этом случае применяется минимальное списание
Пример сценария: клиент хочет сгенерировать 4-секундный рекламный ролик продукта, загрузил 2-секундное рекламное видео продукта и хочет изменить фон и цвета без других входных элементов. Видео относительно простое, и расчет по формуле цена за секунду × количество секунд видео дает расход всего $0.19, но поскольку был загружен видеоматериал, срабатывает минимальное списание, и плата взимается напрямую по минимальному списанию для 4-секундного диапазона ($ 0.30)

Таблица минимального списания

Длительность вывода, сек.	2.0-480P	2.0-720P	2.0-1080P	fast-480P	fast-720P
4	$0.30	$0.65	$1.64	$0.23	$0.50
5	$0.39	$0.84	$2.06	$0.30	$0.64
6	$0.43	$0.93	$2.47	$0.33	$0.71
7	$0.52	$1.11	$2.88	$0.40	$0.85
8	$0.61	$1.30	$3.29	$0.46	$1.00
9	$0.65	$1.39	$3.70	$0.50	$1.07
10	$0.73	$1.58	$4.11	$0.56	$1.21
11	$0.82	$1.76	$4.52	$0.63	$1.35
12	$0.86	$1.86	$4.93	$0.66	$1.43
13	$0.95	$2.04	$5.35	$0.73	$1.57
14	$1.04	$2.23	$5.76	$0.79	$1.71
15	$1.08	$2.32	$6.17	$0.83	$1.78

Это асинхронный API, который возвращает только task_id асинхронной задачи. Используйте этот task_id для запроса API получения результата задачи, чтобы получить результат генерации.

Заголовки запроса

Content-Type

string

обязательно

Перечисляемое значение: application/json

Authorization

string

обязательно

Формат аутентификации Bearer: Bearer {{API 密钥}}.

Тело запроса

fast

boolean

по умолчанию:false

Использовать ли модель быстрой версии (seedance-2.0-fast). Быстрая версия дешевле и генерирует быстрее.

seed

integer

Случайное зерно, используемое для управления случайностью генерируемого контента. Диапазон значений [-1, 2^32-1], -1 означает случайное значение.Диапазон значений: [-1, +∞]

image

string

URL изображения первого кадра или кодировка Base64. Используется в режиме генерации видео из изображения — первый кадр. Поддерживаемые форматы: jpeg/png/webp/bmp/tiff/gif. Диапазон соотношения сторон (0.4, 2.5), диапазон ширины и высоты в пикселях (300, 6000), размер одного изображения не более 30MB.

ratio

string

по умолчанию:"adaptive"

Соотношение сторон генерируемого видео. adaptive означает автоматический выбор наиболее подходящего соотношения сторон на основе входных данных.Допустимые значения: 16:9, 4:3, 1:1, 3:4, 9:16, 21:9, adaptive

prompt

string

Текстовый промпт, описывающий ожидаемое видео. Поддерживаются китайский и английский языки; рекомендуется не более 500 китайских иероглифов или не более 1000 английских слов. Обязателен в режиме генерации видео из текста, в других режимах — необязателен.

duration

integer

по умолчанию:5

Длительность генерируемого видео (в секундах). Диапазон [4,15]Диапазон значений: [4, 15]

watermark

boolean

по умолчанию:false

Должно ли сгенерированное видео содержать водяной знак.

last_image

string

URL изображения последнего кадра или кодировка Base64. Должно передаваться одновременно с полем image для реализации режима генерации видео из изображения — первый и последний кадры. Передача только last_image без image недействительна. Если соотношение сторон изображений первого и последнего кадра различается, основным считается первый кадр, а последний кадр автоматически обрезается и адаптируется.

resolution

string

по умолчанию:"720p"

Разрешение видео. 1080p поддерживается только стандартной версией (fast=false).Допустимые значения: 480p, 720p, 1080p

web_search

boolean

по умолчанию:false

Включать ли интернет-поиск. После включения модель самостоятельно определяет по промпту, нужно ли искать контент в интернете; это может повысить актуальность, но увеличивает задержку.

generate_audio

boolean

по умолчанию:true

Генерировать ли звук, синхронизированный с изображением. При true модель автоматически генерирует подходящую речь, звуковые эффекты и фоновую музыку на основе текста и визуального контента.

reference_audios

array

Список референсных аудио для режима генерации видео по мультимодальным референсам. Каждый элемент — URL аудио или кодировка Base64. Формат wav/mp3, длительность одного аудио [2,15]s, суммарная длительность всех аудио не более 15s, размер одного аудио не более 15MB. Нельзя передавать только аудио; необходимо включить как минимум 1 референсное изображение или видео.Длина массива: 1 - 3

reference_images

array

Список референсных изображений для режима генерации видео по мультимодальным референсам. Каждый элемент — URL изображения или кодировка Base64. Максимум 9 изображений. Способ комбинирования изображений можно указать через промпт; рекомендуется использовать формат «[图1]xxx，[图2]xxx».Длина массива: 1 - 9

reference_videos

array

Список референсных видео для режима генерации видео по мультимодальным референсам. Каждый элемент — URL видео. Формат mp4/mov, разрешение 480p/720p, длительность одного видео [2,15]s, суммарная длительность всех видео не более 15s, размер одного видео не более 50MB.Длина массива: 1 - 3

return_last_frame

boolean

по умолчанию:false

Возвращать ли изображение последнего кадра сгенерированного видео (формат png, без водяного знака). Можно использовать для непрерывной генерации видео: использовать последний кадр как первый кадр следующего сегмента видео.

Информация об ответе

task_id

string

обязательно

Используйте task_id для запроса API получения результата задачи, чтобы получить сгенерированный вывод.

Генерация видео по первому и последнему кадру Veo 3.1 Fast

VIDU Q2 Pro Fast: видео по референсу

​Описание минимального списания

​Таблица минимального списания

​Заголовки запроса

​Тело запроса

​Информация об ответе

Описание минимального списания

Таблица минимального списания

Заголовки запроса

Тело запроса

Информация об ответе