Перейти к основному содержанию
POST
/
v3
/
async
/
wan2.7-r2v
Wanxiang Wan 2.7: видео по референсу
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'
{
  "task_id": "<string>"
}
Модель Wanxiang Wan 2.7 для генерации видео по референсу поддерживает мультимодальный ввод (текст/изображения/видео) и позволяет использовать человека или объект в качестве главного героя для создания видео с выступлением одного персонажа или взаимодействием нескольких персонажей. Поддерживает интеллектуальную раскадровку и генерацию видео с несколькими планами. Поддерживаются разрешения 720P и 1080P, длительность от 2 до 10 секунд, тарификация посекундная. По умолчанию результат содержит аудио.
Это асинхронный API, который возвращает только task_id асинхронной задачи. Используйте этот task_id для запроса API получения результата задачи, чтобы получить результат генерации.

Заголовки запроса

Content-Type
string
обязательно
Перечисляемое значение: application/json
Authorization
string
обязательно
Формат Bearer-аутентификации: Bearer {{API 密钥}}.

Тело запроса

seed
integer
Зерно случайных чисел, используемое для повышения воспроизводимости результатов генерации. Диапазон значений: [0, 2147483647].Диапазон значений: [0, 2147483647]
size
string
по умолчанию:"1920*1080"
Разрешение выходного видео (ширинавысота), влияет на стоимость. Уровень 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Уровень 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Допустимые значения: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632
audio
boolean
по умолчанию:true
Генерировать ли видео со звуком; влияет на стоимость. По умолчанию true (видео со звуком).
media
array
обязательно
Массив референсных медиафайлов, используемый для извлечения внешности персонажа, движений и тембра голоса. В порядке массива соответствует character1, character2 и т. д. в prompt. Количество изображений: 0–5, количество видео: 0–3, общее количество — не более 5. Форматы изображений: JPEG, JPG, PNG, BMP, WEBP; разрешение [240,8000] пикселей, размер не более 10 MB. Форматы видео: MP4, MOV; длительность 1–30 секунд, размер не более 100 MB. Форматы аудио: MP3, WAV, FLAC; длительность 3–30 секунд.Длина массива: 1 - 5
prompt
string
обязательно
Текстовый промпт, описывающий элементы и визуальные характеристики, которые должны присутствовать в генерируемом видео. Используйте идентификаторы character1, character2 и т. д. для ссылки на референсных персонажей; каждый референс (видео или изображение) должен содержать только одного персонажа. Поддерживаются китайский и английский языки, максимум 1500 символов.Ограничение длины: 0 - 1500
duration
integer
по умолчанию:5
Длительность генерируемого видео в секундах; тарификация посекундная. Целое число в диапазоне [2, 10].Диапазон значений: [2, 10]
shot_type
string
по умолчанию:"single"
Тип плана. single — один план (по умолчанию), multi — несколько планов. Этот параметр имеет более высокий приоритет, чем prompt.Допустимые значения: single, multi
watermark
boolean
по умолчанию:false
Добавлять ли водяной знак; водяной знак располагается в правом нижнем углу видео.
negative_prompt
string
Негативный промпт, описывающий содержимое, которое не должно появляться в кадрах видео. Поддерживаются китайский и английский языки, максимум 500 символов.Ограничение длины: 0 - 500

Информация об ответе

task_id
string
Используйте task_id для запроса API получения результата задачи, чтобы получить сгенерированный результат.