ElevenLabs преобразование текста в речь Flash V2

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "stream": true,
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    {}
  ],
  "previous_request_ids": [
    {}
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

POST

elevenlabs-tts-flash-v2

curl --request POST \
  --url https://api.highwayapi.ai/v3/elevenlabs-tts-flash-v2 \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "seed": 123,
  "text": "<string>",
  "stream": true,
  "voice_id": "<string>",
  "next_text": "<string>",
  "language_code": "<string>",
  "output_format": "<string>",
  "previous_text": "<string>",
  "use_pvc_as_ivc": true,
  "voice_settings": {
    "speed": 123,
    "style": 123,
    "stability": 123,
    "similarity_boost": 123,
    "use_speaker_boost": true
  },
  "next_request_ids": [
    {}
  ],
  "previous_request_ids": [
    {}
  ],
  "apply_text_normalization": "<string>",
  "apply_language_text_normalization": true,
  "pronunciation_dictionary_locators": [
    {
      "version_id": "<string>",
      "pronunciation_dictionary_id": "<string>"
    }
  ]
}
'

Преобразует текст в речь с использованием выбранного вами голоса и возвращает аудио.

Заголовки запроса

Content-Type

string

обязательно

Перечисляемое значение: application/json

Authorization

string

обязательно

Формат Bearer-аутентификации: Bearer {{API ключ}}.

Тело запроса

seed

integer

Если указано, система будет стремиться выполнять выборку детерминированно. Повторные запросы с одинаковыми seed и параметрами должны возвращать одинаковый результат, но полная детерминированность не гарантируется.Диапазон значений: [0, 4294967295]

text

string

обязательно

Текст для преобразования в речь.

stream

boolean

Включать ли режим Stream

voice_id

string

обязательно

ID голоса, который нужно использовать.

next_text

string

Текст, следующий за текстом текущего запроса. Используется для улучшения связности речи при объединении нескольких генераций.

language_code

string

Код языка для модели и нормализации текста (ISO 639-1). Если модель не поддерживает этот код языка, будет возвращена ошибка.

output_format

string

по умолчанию:"mp3_44100_128"

Выходной формат сгенерированного аудио. Формат: codec_sample_rate_bitrate. Битрейт MP3 192 kbps требует аккаунт уровня Creator или выше, частота дискретизации PCM 44.1 kHz требует аккаунт уровня Pro или выше.Допустимые значения: mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192

previous_text

string

Текст, предшествующий тексту текущего запроса. Используется для улучшения связности речи при объединении нескольких генераций.

use_pvc_as_ivc

boolean

по умолчанию:false

Если true, используется IVC-версия голоса вместо PVC-версии. Это временное решение для высокой задержки PVC-версии.

voice_settings

object

Скрыть properties

speed

number

по умолчанию:1

Настраивает скорость речи. 1.0 — скорость по умолчанию; значения меньше 1.0 замедляют речь, значения больше 1.0 ускоряют речь.

style

number

по умолчанию:0

Определяет степень выразительности стиля речи. Пытается усилить стиль исходного говорящего. При значении, отличном от 0, потребляется больше вычислительных ресурсов и может увеличиться задержка.

stability

number

Определяет стабильность генерации речи и степень случайности между генерациями. Более низкие значения дают более широкий эмоциональный диапазон, более высокие значения могут сделать речь монотонной.

similarity_boost

number

Определяет, насколько точно AI пытается воспроизвести исходный голос.

use_speaker_boost

boolean

по умолчанию:true

Усиливает сходство с исходным говорящим. Требует немного большей вычислительной нагрузки и увеличивает задержку.

next_request_ids

array

Список request_id последующих образцов. Используется для сохранения связности речи при повторной генерации образцов. Можно передать не более 3 request_id.Длина массива: 0 - 3

previous_request_ids

array

Список request_id уже сгенерированных образцов перед текущей генерацией. Может использоваться для улучшения связности речи. Можно передать не более 3 request_id.Длина массива: 0 - 3

apply_text_normalization

string

по умолчанию:"auto"

Управляет нормализацией текста. ‘auto’ — решение принимает система, ‘on’ — всегда нормализовать, ‘off’ — пропустить нормализацию.Допустимые значения: auto, on, off

apply_language_text_normalization

boolean

по умолчанию:false

Управляет языковой нормализацией текста для некоторых поддерживаемых языков, чтобы добиться более естественного произношения. Предупреждение: может значительно увеличить задержку. В настоящее время поддерживается только японский язык.

pronunciation_dictionary_locators

array

Список локаторов словарей произношения (id, version_id), которые нужно применить к тексту. Применяются по порядку. В каждом запросе может быть не более 3 локаторов.Длина массива: 0 - 3

Скрыть properties

version_id

string

ID версии словаря произношения. Если не указан, используется последняя версия.

pronunciation_dictionary_id

string

обязательно

ID словаря произношения.

Информация об ответе

Сгенерированный аудиофайл Формат: binary

ElevenLabs преобразование речи в текст V2

ElevenLabs Преобразование текста в речь Flash V2.5

​Заголовки запроса

​Тело запроса

​Информация об ответе

Заголовки запроса

Тело запроса

Информация об ответе