Перейти к основному содержанию
POST
/
v3
/
glm-tts
Синтез речи GLM
curl --request POST \
  --url https://api.highwayapi.ai/v3/glm-tts \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "input": "<string>",
  "speed": 123,
  "voice": "<string>",
  "volume": 123,
  "response_format": "<string>",
  "watermark_enabled": true
}
'
Используйте GLM-TTS для преобразования текста в естественную речь с поддержкой различных голосов, управления эмоциями и настройки интонации.

Заголовки запроса

Content-Type
string
обязательно
Перечисляемое значение: application/json
Authorization
string
обязательно
Формат аутентификации Bearer: Bearer {{API 密钥}}.

Тело запроса

input
string
обязательно
Текст для преобразования в речьОграничение длины: 0–1024
speed
number
по умолчанию:1
Скорость речи, по умолчанию 1.0, диапазон значений [0.5, 2]Диапазон значений: [0.5, 2]
voice
string
по умолчанию:"tongtong"
обязательно
Тембр голоса, используемый при генерации аудио; поддерживаются два типа: системные голоса и клонированные голоса. Системные голоса включают: tongtong (Тунтун, голос по умолчанию), chuichui (Чуйчуй), xiaochen (Сяочэнь), jam (голос jam из «Дундун — круг животных»), kazi (голос kazi из «Дундун — круг животных»), douji (голос douji из «Дундун — круг животных»), luodo (голос luodo из «Дундун — круг животных»)
volume
number
по умолчанию:1
Громкость, по умолчанию 1.0, диапазон значений (0, 10]Диапазон значений: [0, 10]
response_format
string
по умолчанию:"pcm"
Формат выходного аудио; по умолчанию возвращается файл в формате pcmДопустимые значения: wav, pcm
watermark_enabled
boolean
Управляет тем, добавляется ли водяной знак в аудио, сгенерированное AI. true: по умолчанию включены явный водяной знак для AI-сгенерированного контента и неявный цифровой водяной знак в соответствии с требованиями политики. false: отключает все водяные знаки; действует только для пользователей, которые уже выполнили действие по удалению водяного знака.

Информация об ответе

Бизнес-обработка выполнена успешно, рекомендуемая частота дискретизации — 24000 Формат: binary