Wanxiang Wan 2.7: видео по референсу

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

POST

async

wan2.7-r2v

Wanxiang Wan 2.7: видео по референсу

curl --request POST \
  --url https://api.highwayapi.ai/v3/async/wan2.7-r2v \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "size": "<string>",
  "audio": true,
  "media": [
    {
      "url": "<string>",
      "type": "<string>",
      "reference_voice": "<string>"
    }
  ],
  "prompt": "<string>",
  "duration": 123,
  "shot_type": "<string>",
  "watermark": true,
  "negative_prompt": "<string>"
}
'

{
  "task_id": "<string>"
}

Модель Wanxiang Wan 2.7 для генерации видео по референсу поддерживает мультимодальный ввод (текст/изображения/видео) и позволяет использовать человека или объект в качестве главного героя для создания видео с выступлением одного персонажа или взаимодействием нескольких персонажей. Поддерживает интеллектуальную раскадровку и генерацию видео с несколькими планами. Поддерживаются разрешения 720P и 1080P, длительность от 2 до 10 секунд, тарификация посекундная. По умолчанию результат содержит аудио.

Это асинхронный API, который возвращает только task_id асинхронной задачи. Используйте этот task_id для запроса API получения результата задачи, чтобы получить результат генерации.

Заголовки запроса

Content-Type

string

обязательно

Перечисляемое значение: application/json

Authorization

string

обязательно

Формат Bearer-аутентификации: Bearer {{API 密钥}}.

Тело запроса

seed

integer

Зерно случайных чисел, используемое для повышения воспроизводимости результатов генерации. Диапазон значений: [0, 2147483647].Диапазон значений: [0, 2147483647]

size

string

по умолчанию:"1920*1080"

Разрешение выходного видео (ширинавысота), влияет на стоимость. Уровень 720P: 1280720 (16:9), 7201280 (9:16), 960960 (1:1), 1088832 (4:3), 8321088 (3:4). Уровень 1080P: 19201080 (16:9), 10801920 (9:16), 14401440 (1:1), 16321248 (4:3), 1248*1632 (3:4).Допустимые значения: 1280*720, 720*1280, 960*960, 1088*832, 832*1088, 1920*1080, 1080*1920, 1440*1440, 1632*1248, 1248*1632

audio

boolean

по умолчанию:true

Генерировать ли видео со звуком; влияет на стоимость. По умолчанию true (видео со звуком).

media

array

обязательно

Массив референсных медиафайлов, используемый для извлечения внешности персонажа, движений и тембра голоса. В порядке массива соответствует character1, character2 и т. д. в prompt. Количество изображений: 0–5, количество видео: 0–3, общее количество — не более 5. Форматы изображений: JPEG, JPG, PNG, BMP, WEBP; разрешение [240,8000] пикселей, размер не более 10 MB. Форматы видео: MP4, MOV; длительность 1–30 секунд, размер не более 100 MB. Форматы аудио: MP3, WAV, FLAC; длительность 3–30 секунд.Длина массива: 1 - 5

Скрыть properties

url

string

обязательно

URL медиафайла.

type

string

обязательно

Тип медиа. reference_image: референсное изображение для извлечения внешности персонажа; reference_video: референсное видео для извлечения движений и внешности персонажа; first_frame: изображение первого кадра для управления начальным кадром видео.Допустимые значения: reference_image, reference_video, first_frame

reference_voice

string

URL референсного аудио персонажа, используемый для клонирования тембра голоса персонажа и генерации видео со звуком. Форматы: MP3, WAV, FLAC; длительность 3–30 секунд.

prompt

string

обязательно

Текстовый промпт, описывающий элементы и визуальные характеристики, которые должны присутствовать в генерируемом видео. Используйте идентификаторы character1, character2 и т. д. для ссылки на референсных персонажей; каждый референс (видео или изображение) должен содержать только одного персонажа. Поддерживаются китайский и английский языки, максимум 1500 символов.Ограничение длины: 0 - 1500

duration

integer

по умолчанию:5

Длительность генерируемого видео в секундах; тарификация посекундная. Целое число в диапазоне [2, 10].Диапазон значений: [2, 10]

shot_type

string

по умолчанию:"single"

Тип плана. single — один план (по умолчанию), multi — несколько планов. Этот параметр имеет более высокий приоритет, чем prompt.Допустимые значения: single, multi

watermark

boolean

по умолчанию:false

Добавлять ли водяной знак; водяной знак располагается в правом нижнем углу видео.

negative_prompt

string

Негативный промпт, описывающий содержимое, которое не должно появляться в кадрах видео. Поддерживаются китайский и английский языки, максимум 500 символов.Ограничение длины: 0 - 500

Информация об ответе

task_id

string

Используйте task_id для запроса API получения результата задачи, чтобы получить сгенерированный результат.

Wanxiang Wan 2.7: текст-в-видео

Видеоредактирование Wanxiang Wan 2.7

​Заголовки запроса

​Тело запроса

​Информация об ответе

Заголовки запроса

Тело запроса

Информация об ответе