MiniMax Speech 2.8 Turbo 同步语音合成
音频
MiniMax Speech 2.8 Turbo 同步语音合成
POST
MiniMax Speech 2.8 Turbo 同步语音合成
将文本转换为语音,支持多种音色、情绪控制、语速调节等功能。文本长度限制小于 10000 字符,若文本长度大于 3000 字符,推荐使用流式输出。
请求头
枚举值:
application/jsonBearer 身份验证格式: Bearer {{API 密钥}}。
请求体
需要合成语音的文本,长度限制小于 10000 字符,若文本长度大于 3000 字符,推荐使用流式输出。支持段落切换(换行符)、停顿控制(
<#x#>标记)、语气词标签(如(laughs)、(coughs)等,仅 speech-2.8-hd/turbo 支持)控制是否流式输出。默认 false,即不开启流式
控制输出结果形式的参数,可选值范围为 url、hex,默认值为 hex。该参数仅在非流式场景生效,流式场景仅支持返回 hex 形式。返回的 url 有效期为 24 小时可选值:
url, hex控制在合成音频的末尾添加音频节奏标识,默认值为 false。该参数仅对非流式合成生效
是否增强对指定的小语种和方言的识别能力。默认值为 null,可设置为 auto 让模型自主判断可选值:
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto混合音色设置,最多支持 4 种音色混合
控制是否开启字幕服务,默认值为 false。此参数仅在非流式输出场景下有效,且仅对 speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd 模型有效
启用该参数,使得子句衔接处更自然,仅支持 speech-2.8-hd 和 speech-2.8-turbo 模型
响应信息
返回的合成数据对象,可能为 null,需进行非空判断
本次会话的 id,用于在咨询/反馈时帮助定位问题
本次请求的状态码和详情
音频的附加信息