ElevenLabs Преобразование текста в речь Flash V2.5

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2.5 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "stream": true,
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    {}
  ],
  "previous_request_ids": [
    {}
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

POST

elevenlabs-tts-flash-v2.5

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2.5 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "stream": true,
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    {}
  ],
  "previous_request_ids": [
    {}
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

Преобразует текст в речь с использованием выбранного вами голоса и возвращает аудио.

Заголовки запроса

Content-Type

string

обязательно

Перечисляемое значение: application/json

Authorization

string

обязательно

Формат аутентификации Bearer: Bearer {{API 密钥}}.

Тело запроса

seed

integer

Если указано, система будет стараться выполнять детерминированную выборку. Повторные запросы с одинаковыми seed и параметрами должны возвращать одинаковый результат, но полная детерминированность не гарантируется.Диапазон значений: [0, 4294967295]

text

string

обязательно

Текст для преобразования в речь.

stream

boolean

Включить ли режим Stream

voice_id

string

обязательно

ID голоса, который нужно использовать.

next_text

string

Текст после текста текущего запроса. Используется для улучшения связности речи при объединении нескольких генераций.

language_code

string

Код языка (ISO 639-1), используемый для модели и нормализации текста. Если модель не поддерживает этот код языка, будет возвращена ошибка.

output_format

string

по умолчанию:"mp3_44100_128"

Формат вывода сгенерированного аудио. Формат: codec_sample_rate_bitrate. Битрейт MP3 192 кбит/с требует учетной записи Creator или выше, частота дискретизации PCM 44,1 кГц требует учетной записи Pro или выше.Допустимые значения: mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192

previous_text

string

Текст перед текстом текущего запроса. Используется для улучшения связности речи при объединении нескольких генераций.

use_pvc_as_ivc

boolean

по умолчанию:false

Если true, используется IVC-версия голоса вместо PVC-версии. Это временное решение для более высокой задержки PVC-версии.

voice_settings

object

Скрыть properties

speed

number

по умолчанию:1

Регулирует скорость речи. 1.0 — скорость по умолчанию; значение меньше 1.0 замедляет речь, а больше 1.0 ускоряет речь.

style

number

по умолчанию:0

Определяет степень выразительности стиля речи. Пытается усилить стиль исходного говорящего. При установке ненулевого значения потребляет больше вычислительных ресурсов и может увеличить задержку.

stability

number

Определяет стабильность генерации речи и случайность между генерациями. Более низкие значения дают более широкий эмоциональный диапазон, более высокие значения могут привести к монотонной речи.

similarity_boost

number

Определяет, насколько точно AI пытается воспроизвести исходный голос.

use_speaker_boost

boolean

по умолчанию:true

Усиливает сходство с исходным говорящим. Требует немного большей вычислительной нагрузки и увеличивает задержку.

next_request_ids

array

Список request_id последующих образцов. Используется для сохранения связности речи при повторной генерации образцов. Можно передать не более 3 request_id.Длина массива: 0 - 3

previous_request_ids

array

Список request_id образцов, уже сгенерированных перед текущей генерацией. Может использоваться для улучшения связности речи. Можно передать не более 3 request_id.Длина массива: 0 - 3

apply_text_normalization

string

по умолчанию:"auto"

Управляет нормализацией текста. ‘auto’ — определяется системой, ‘on’ — всегда нормализовать, ‘off’ — пропустить.Допустимые значения: auto, on, off

apply_language_text_normalization

boolean

по умолчанию:false

Управляет языковой нормализацией текста для некоторых поддерживаемых языков, чтобы обеспечить более естественное произношение. Предупреждение: может значительно увеличить задержку. В настоящее время поддерживается только японский язык.

pronunciation_dictionary_locators

array

Список локаторов словарей произношения (id, version_id), которые нужно применить к тексту. Применяются по порядку. В каждом запросе может быть не более 3 локаторов.Длина массива: 0 - 3

Скрыть properties

version_id

string

ID версии словаря произношения. Если не указан, используется последняя версия.

pronunciation_dictionary_id

string

обязательно

ID словаря произношения.

Информация об ответе

Сгенерированный аудиофайл Формат: binary

ElevenLabs преобразование текста в речь Flash V2

ElevenLabs преобразование текста в речь Multilingual V2

​Заголовки запроса

​Тело запроса

​Информация об ответе

Заголовки запроса

Тело запроса

Информация об ответе