跳转到主要内容
POST
https://api.jiekou.ai
/
v3
/
glm-tts
GLM 语音合成
curl --request POST \
  --url https://api.jiekou.ai/v3/glm-tts \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "input": "<string>",
  "speed": 123,
  "voice": "<string>",
  "volume": 123,
  "response_format": "<string>",
  "watermark_enabled": true
}
'
使用 GLM-TTS 将文本转换为自然语音,支持多种声音、情感控制和语调调整。

请求头

Content-Type
string
必填
枚举值: application/json
Authorization
string
必填
Bearer 身份验证格式: Bearer {{API 密钥}}。

请求体

input
string
必填
要转换为语音的文本长度限制:0 - 1024
speed
number
默认值:1
语速,默认1.0,取值范围[0.5, 2]取值范围:[0.5, 2]
voice
string
默认值:"tongtong"
必填
生成音频时使用的音色,支持系统音色以及复刻音色两种类型。系统音色包括:tongtong(彤彤,默认音色)、chuichui(锤锤)、xiaochen(小陈)、jam(动动动物圈jam音色)、kazi(动动动物圈kazi音色)、douji(动动动物圈douji音色)、luodo(动动动物圈luodo音色)
volume
number
默认值:1
音量,默认1.0,取值范围(0, 10]取值范围:[0, 10]
response_format
string
默认值:"pcm"
音频输出格式,默认返回pcm格式的文件可选值:wav, pcm
watermark_enabled
boolean
控制AI生成音频时是否添加水印。true: 默认启用AI生成的显式水印及隐式数字水印,符合政策要求。false: 关闭所有水印,仅对已完成去水印动作的用户生效。

响应

业务处理成功,采样率建议设置为24000 格式: binary