跳转到主要内容
POST
/
v3
/
moss-tts
/
v1
/
audio
/
speech
MOSS TTS
curl --request POST \
  --url https://api.highwayapi.ai/v3/moss-tts/v1/audio/speech \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>'
MOSS TTS v1.5 文本转语音 API。支持 JSON body 与 multipart(参考音频) 两种请求方式;返回完整 WAV 或流式 PCM 音频二进制。

请求头

Content-Type
string
必填
枚举值: application/json, multipart/form-data
Authorization
string
必填
Bearer 身份验证格式: Bearer {{API 密钥}}。

请求体

input
string
必填
必填,要合成的文本。建议一次提交完整句子或段落。
model
string
默认值:"MOSS-TTS"
必填
必填,固定填写 MOSS-TTS,用于选择 MOSS TTS v1.5。可选值:MOSS-TTS
stream
boolean
默认值:false
可选,false 返回完整 WAV;true 返回 PCM 流,适合边生成边播放。
response_format
string
默认值:"wav"
可选,非流式填 wav;stream=true 时必须填 pcm。可选值:wav, pcm

响应信息

成功返回音频二进制。非流式为完整 WAV;流式为 raw PCM chunks。流式 PCM 通过响应头描述格式(缺省 48000Hz/单声道/16-bit little-endian)。 格式: binary