メインコンテンツへスキップ
POST
/
v3
/
minimax-speech-2.8-turbo
MiniMax Speech 2.8 Turbo 同期音声合成
curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-speech-2.8-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "stream": true,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "force_cbr": true,
    "sample_rate": 123
  },
  "output_format": "<string>",
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "latex_read": true,
    "text_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "stream_options": {
    "exclude_aggregated_audio": true
  },
  "timber_weights": [
    {
      "weight": 123,
      "voice_id": "<string>"
    }
  ],
  "subtitle_enable": true,
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  }
}
'
{
  "data": {},
  "trace_id": "<string>",
  "base_resp": {},
  "extra_info": {}
}
テキストを音声に変換します。複数の音色、感情制御、話速調整などの機能に対応しています。テキスト長は 10000 文字未満に制限されます。テキスト長が 3000 文字を超える場合は、ストリーミング出力の使用を推奨します。

リクエストヘッダー

Content-Type
string
必須
列挙値: application/json
Authorization
string
必須
Bearer 認証形式: Bearer {{API Key}}。

リクエストボディ

text
string
必須
音声合成するテキスト。長さは 10000 文字未満に制限されます。テキスト長が 3000 文字を超える場合は、ストリーミング出力の使用を推奨します。段落切り替え(改行)、ポーズ制御(&lt;#x#&gt; マーク)、フィラータグ((laughs)、(coughs) など。speech-2.8-hd/turbo のみ対応)をサポートします
stream
boolean
デフォルト:false
ストリーミング出力するかどうかを制御します。デフォルトは false、つまりストリーミングは有効化されません
voice_modify
object
audio_setting
object
output_format
string
デフォルト:"hex"
出力結果形式を制御するパラメータです。選択可能な値の範囲は url、hex で、デフォルト値は hex です。このパラメータは非ストリーミングシナリオでのみ有効です。ストリーミングシナリオでは hex 形式の返却のみサポートされます。返却される url の有効期限は 24 時間です選択可能な値:url, hex
voice_setting
object
aigc_watermark
boolean
デフォルト:false
合成音声の末尾に音声リズム識別子を追加するかどうかを制御します。デフォルト値は false です。このパラメータは非ストリーミング合成にのみ有効です
language_boost
string
指定した少数言語および方言の認識能力を強化するかどうか。デフォルト値は null です。auto に設定すると、モデルに自律的に判断させることができます選択可能な値:Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto
stream_options
object
timber_weights
array
混合音色設定。最大 4 種類の音色混合をサポートします
subtitle_enable
boolean
デフォルト:false
字幕サービスを有効にするかどうかを制御します。デフォルト値は false です。このパラメータは非ストリーミング出力シナリオでのみ有効であり、speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd モデルに対してのみ有効です
continuous_sound
boolean
デフォルト:false
このパラメータを有効にすると、句と句のつなぎ目がより自然になります。speech-2.8-hd および speech-2.8-turbo モデルのみ対応しています
pronunciation_dict
object

レスポンス情報

data
object
返却される合成データオブジェクト。null の可能性があるため、非 null 判定が必要です
trace_id
string
今回のセッションの id。問い合わせ/フィードバック時に問題の特定に役立ちます
base_resp
object
今回のリクエストのステータスコードと詳細
extra_info
object
音声の追加情報