Синтез речи GLM
Аудио
Синтез речи GLM
POST
Синтез речи GLM
Используйте GLM-TTS для преобразования текста в естественную речь с поддержкой различных голосов, управления эмоциями и настройки интонации.
Заголовки запроса
Перечисляемое значение:
application/jsonФормат аутентификации Bearer: Bearer {{API 密钥}}.
Тело запроса
Текст для преобразования в речьОграничение длины: 0–1024
Скорость речи, по умолчанию 1.0, диапазон значений [0.5, 2]Диапазон значений: [0.5, 2]
Тембр голоса, используемый при генерации аудио; поддерживаются два типа: системные голоса и клонированные голоса. Системные голоса включают: tongtong (Тунтун, голос по умолчанию), chuichui (Чуйчуй), xiaochen (Сяочэнь), jam (голос jam из «Дундун — круг животных»), kazi (голос kazi из «Дундун — круг животных»), douji (голос douji из «Дундун — круг животных»), luodo (голос luodo из «Дундун — круг животных»)
Громкость, по умолчанию 1.0, диапазон значений (0, 10]Диапазон значений: [0, 10]
Формат выходного аудио; по умолчанию возвращается файл в формате pcmДопустимые значения:
wav, pcmУправляет тем, добавляется ли водяной знак в аудио, сгенерированное AI. true: по умолчанию включены явный водяной знак для AI-сгенерированного контента и неявный цифровой водяной знак в соответствии с требованиями политики. false: отключает все водяные знаки; действует только для пользователей, которые уже выполнили действие по удалению водяного знака.
Информация об ответе
Бизнес-обработка выполнена успешно, рекомендуемая частота дискретизации — 24000 Формат:binary