GLM 语音合成 - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-tts \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "input": "<string>", "speed": 123, "voice": "<string>", "volume": 123, "response_format": "<string>", "watermark_enabled": true } '

使用 GLM-TTS 将文本转换为自然语音，支持多种声音、情感控制和语调调整。

请求头

Content-Type

string

必填

枚举值: application/json

Authorization

string

必填

Bearer 身份验证格式: Bearer {{API 密钥}}。

请求体

input

string

必填

要转换为语音的文本长度限制：0 - 1024

speed

number

默认值:1

语速，默认1.0，取值范围[0.5, 2]取值范围：[0.5, 2]

voice

string

默认值:"tongtong"

必填

生成音频时使用的音色，支持系统音色以及复刻音色两种类型。系统音色包括：tongtong(彤彤，默认音色)、chuichui(锤锤)、xiaochen(小陈)、jam(动动动物圈jam音色)、kazi(动动动物圈kazi音色)、douji(动动动物圈douji音色)、luodo(动动动物圈luodo音色)

volume

number

默认值:1

音量，默认1.0，取值范围(0, 10]取值范围：[0, 10]

response_format

string

默认值:"pcm"

音频输出格式，默认返回pcm格式的文件可选值：wav, pcm

watermark_enabled

boolean

控制AI生成音频时是否添加水印。true: 默认启用AI生成的显式水印及隐式数字水印，符合政策要求。false: 关闭所有水印，仅对已完成去水印动作的用户生效。

响应信息

业务处理成功，采样率建议设置为24000 格式: binary

​请求头

​请求体

​响应信息

请求头

请求体

响应信息