Перейти к основному содержанию
POST
/
v3
/
minimax-speech-2.8-turbo
MiniMax Speech 2.8 Turbo: синхронный синтез речи
curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "stream": true,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "force_cbr": true,
    "sample_rate": 123
  },
  "output_format": "<string>",
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "latex_read": true,
    "text_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "stream_options": {
    "exclude_aggregated_audio": true
  },
  "timber_weights": [
    {
      "weight": 123,
      "voice_id": "<string>"
    }
  ],
  "subtitle_enable": true,
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  }
}
'
{
  "data": {},
  "trace_id": "<string>",
  "base_resp": {},
  "extra_info": {}
}
Преобразует текст в речь и поддерживает различные голоса, управление эмоциями, настройку скорости речи и другие функции. Ограничение длины текста — менее 10000 символов. Если длина текста превышает 3000 символов, рекомендуется использовать потоковый вывод.

Заголовки запроса

Content-Type
string
обязательно
Перечисляемое значение: application/json
Authorization
string
обязательно
Формат Bearer-аутентификации: Bearer {{API 密钥}}.

Тело запроса

text
string
обязательно
Текст, который необходимо синтезировать в речь. Ограничение длины — менее 10000 символов. Если длина текста превышает 3000 символов, рекомендуется использовать потоковый вывод. Поддерживает переключение абзацев (символы новой строки), управление паузами (метки &lt;#x#&gt;), теги междометий/звуковых реакций (например, (laughs), (coughs) и т. д.; поддерживается только speech-2.8-hd/turbo)
stream
boolean
по умолчанию:false
Управляет тем, будет ли вывод потоковым. По умолчанию false, то есть потоковый вывод не включен
voice_modify
object
audio_setting
object
output_format
string
по умолчанию:"hex"
Параметр, управляющий формой результата вывода. Возможные значения: url, hex; значение по умолчанию — hex. Этот параметр действует только в непотоковом сценарии; в потоковом сценарии поддерживается возврат только в форме hex. Возвращаемый url действителен 24 часаВозможные значения: url, hex
voice_setting
object
aigc_watermark
boolean
по умолчанию:false
Управляет добавлением ритмического аудиоидентификатора в конец синтезированного аудио. Значение по умолчанию — false. Этот параметр действует только для непотокового синтеза
language_boost
string
Усиливать ли способность распознавания указанных малораспространенных языков и диалектов. Значение по умолчанию — null; можно установить auto, чтобы модель определяла это самостоятельноВозможные значения: Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto
stream_options
object
timber_weights
array
Настройки смешанного голоса; поддерживается смешивание максимум 4 голосов
subtitle_enable
boolean
по умолчанию:false
Управляет включением службы субтитров. Значение по умолчанию — false. Этот параметр действует только в сценарии непотокового вывода и только для моделей speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd
continuous_sound
boolean
по умолчанию:false
Включите этот параметр, чтобы стыки между фразами звучали более естественно. Поддерживаются только модели speech-2.8-hd и speech-2.8-turbo
pronunciation_dict
object

Информация ответа

data
object
Возвращаемый объект синтезированных данных; может быть null, поэтому требуется проверка на непустое значение
trace_id
string
id текущей сессии, используемый для помощи в локализации проблемы при обращении за консультацией или отправке отзыва
base_resp
object
Код состояния и сведения о текущем запросе
extra_info
object
Дополнительная информация об аудио