Синтез речи GLM - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-tts \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "input": "<string>", "speed": 123, "voice": "<string>", "volume": 123, "response_format": "<string>", "watermark_enabled": true } '

Используйте GLM-TTS для преобразования текста в естественную речь с поддержкой различных голосов, управления эмоциями и настройки интонации.

Заголовки запроса

Content-Type

string

обязательно

Перечисляемое значение: application/json

Authorization

string

обязательно

Формат аутентификации Bearer: Bearer {{API 密钥}}.

Тело запроса

input

string

обязательно

Текст для преобразования в речьОграничение длины: 0–1024

speed

number

по умолчанию:1

Скорость речи, по умолчанию 1.0, диапазон значений [0.5, 2]Диапазон значений: [0.5, 2]

voice

string

по умолчанию:"tongtong"

обязательно

Тембр голоса, используемый при генерации аудио; поддерживаются два типа: системные голоса и клонированные голоса. Системные голоса включают: tongtong (Тунтун, голос по умолчанию), chuichui (Чуйчуй), xiaochen (Сяочэнь), jam (голос jam из «Дундун — круг животных»), kazi (голос kazi из «Дундун — круг животных»), douji (голос douji из «Дундун — круг животных»), luodo (голос luodo из «Дундун — круг животных»)

volume

number

по умолчанию:1

Громкость, по умолчанию 1.0, диапазон значений (0, 10]Диапазон значений: [0, 10]

response_format

string

по умолчанию:"pcm"

Формат выходного аудио; по умолчанию возвращается файл в формате pcmДопустимые значения: wav, pcm

watermark_enabled

boolean

Управляет тем, добавляется ли водяной знак в аудио, сгенерированное AI. true: по умолчанию включены явный водяной знак для AI-сгенерированного контента и неявный цифровой водяной знак в соответствии с требованиями политики. false: отключает все водяные знаки; действует только для пользователей, которые уже выполнили действие по удалению водяного знака.

Информация об ответе

Бизнес-обработка выполнена успешно, рекомендуемая частота дискретизации — 24000 Формат: binary

​Заголовки запроса

​Тело запроса

​Информация об ответе

Заголовки запроса

Тело запроса

Информация об ответе