ElevenLabs преобразование текста в речь Multilingual V2

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-multilingual-v2 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    {}
  ],
  "previous_request_ids": [
    {}
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

POST

elevenlabs-tts-multilingual-v2

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-multilingual-v2 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    {}
  ],
  "previous_request_ids": [
    {}
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

Преобразует текст в речь с выбранным вами голосом и возвращает аудио.

Заголовки запроса

Content-Type

string

обязательно

Значения перечисления: application/json

Authorization

string

обязательно

Формат аутентификации Bearer: Bearer {{API 密钥}}.

Тело запроса

seed

integer

Если указано, система постарается выполнять сэмплирование детерминированно. Повторные запросы с тем же seed и параметрами должны возвращать один и тот же результат, но полная детерминированность не гарантируется.Диапазон значений: [0, 4294967295]

text

string

обязательно

Текст, который нужно преобразовать в речь.

voice_id

string

обязательно

ID голоса, который нужно использовать.

next_text

string

Текст, следующий после текста текущего запроса. Используется для улучшения связности речи при объединении нескольких генераций.

language_code

string

Код языка (ISO 639-1), используемый для модели и нормализации текста. Если модель не поддерживает этот код языка, будет возвращена ошибка.

output_format

string

по умолчанию:"mp3_44100_128"

Выходной формат сгенерированного аудио. Формат: codec_sample_rate_bitrate. Битрейт MP3 192 kbps требует аккаунт Creator или выше, частота дискретизации PCM 44.1 kHz требует аккаунт Pro или выше.Допустимые значения: mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192

previous_text

string

Текст, предшествующий тексту текущего запроса. Используется для улучшения связности речи при объединении нескольких генераций.

use_pvc_as_ivc

boolean

по умолчанию:false

Если true, используется IVC-версия голоса вместо PVC-версии. Это временное решение для повышенной задержки PVC-версии.

voice_settings

object

Скрыть properties

speed

number

по умолчанию:1

Регулирует скорость речи. 1.0 — скорость по умолчанию; значение меньше 1.0 замедляет речь, значение больше 1.0 ускоряет речь.

style

number

по умолчанию:0

Определяет степень выразительности стиля речи. Пытается усилить стиль исходного говорящего. При ненулевом значении расходуется больше вычислительных ресурсов и может увеличиться задержка.

stability

number

Определяет стабильность генерации речи и случайность между отдельными генерациями. Более низкие значения дают более широкий эмоциональный диапазон, а более высокие могут привести к монотонной речи.

similarity_boost

number

Определяет, насколько точно ИИ пытается воспроизвести исходный голос.

use_speaker_boost

boolean

по умолчанию:true

Усиливает сходство с исходным говорящим. Требует немного большей вычислительной нагрузки и увеличивает задержку.

next_request_ids

array

Список request_id последующих сэмплов. Используется для сохранения связности речи при повторной генерации сэмплов. Можно передать не более 3 request_id.Длина массива: 0 - 3

previous_request_ids

array

Список request_id сэмплов, уже сгенерированных перед текущей генерацией. Может использоваться для улучшения связности речи. Можно передать не более 3 request_id.Длина массива: 0 - 3

apply_text_normalization

string

по умолчанию:"auto"

Управляет нормализацией текста. ‘auto’ — решение принимает система, ‘on’ — всегда выполнять нормализацию, ‘off’ — пропускать.Допустимые значения: auto, on, off

apply_language_text_normalization

boolean

по умолчанию:false

Управляет языковой нормализацией текста для некоторых поддерживаемых языков, чтобы добиться более естественного произношения. Предупреждение: может значительно увеличить задержку. В настоящее время поддерживается только японский.

pronunciation_dictionary_locators

array

Список локаторов словарей произношения (id, version_id), которые нужно применить к тексту. Применяются по порядку. В одном запросе может быть не более 3 локаторов.Длина массива: 0 - 3

Скрыть properties

version_id

string

ID версии словаря произношения. Если не указан, используется последняя версия.

pronunciation_dictionary_id

string

обязательно

ID словаря произношения.

Информация об ответе

Сгенерированный аудиофайл Формат: binary

ElevenLabs Преобразование текста в речь Flash V2.5

ElevenLabs преобразование текста в речь Turbo V2.5

​Заголовки запроса

​Тело запроса

​Информация об ответе

Заголовки запроса

Тело запроса

Информация об ответе