MOSS TTS - 接口AI 文档中心

MOSS TTS v1.5 文本转语音 API。支持 JSON body 与 multipart(参考音频) 两种请求方式；返回完整 WAV 或流式 PCM 音频二进制。

请求头

Content-Type

string

必填

枚举值: application/json, multipart/form-data

Authorization

string

必填

Bearer 身份验证格式: Bearer {{API 密钥}}。

input

string

必填

必填，要合成的文本。建议一次提交完整句子或段落。

model

string

默认值:"MOSS-TTS"

必填

必填，固定填写 MOSS-TTS，用于选择 MOSS TTS v1.5。可选值：MOSS-TTS

stream

boolean

默认值:false

可选，false 返回完整 WAV；true 返回 PCM 流，适合边生成边播放。

response_format

string

默认值:"wav"

可选，非流式填 wav；stream=true 时必须填 pcm。可选值：wav, pcm

成功返回音频二进制。非流式为完整 WAV；流式为 raw PCM chunks。流式 PCM 通过响应头描述格式(缺省 48000Hz/单声道/16-bit little-endian)。格式: binary