メインコンテンツへスキップ
POST
/
v3
/
minimax-speech-2.8-hd
MiniMax Speech 2.8 HD 同期音声合成
curl --request POST \
  --url https://api.highwayapi.ai/v3/minimax-speech-2.8-hd \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "stream": true,
  "voice_modify": {
    "pitch": 123,
    "timbre": 123,
    "intensity": 123,
    "sound_effects": "<string>"
  },
  "audio_setting": {
    "format": "<string>",
    "bitrate": 123,
    "channel": 123,
    "force_cbr": true,
    "sample_rate": 123
  },
  "output_format": "<string>",
  "voice_setting": {
    "vol": 123,
    "pitch": 123,
    "speed": 123,
    "emotion": "<string>",
    "voice_id": "<string>",
    "latex_read": true,
    "text_normalization": true
  },
  "aigc_watermark": true,
  "language_boost": "<string>",
  "stream_options": {
    "exclude_aggregated_audio": true
  },
  "timber_weights": [
    {
      "weight": 123,
      "voice_id": "<string>"
    }
  ],
  "subtitle_enable": true,
  "continuous_sound": true,
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  }
}
'
{
  "data": {},
  "trace_id": "<string>",
  "base_resp": {},
  "extra_info": {}
}
テキストを音声に変換し、複数の音色、感情制御、話速調整などの機能に対応しています。テキスト長の上限は 10000 文字未満です。テキスト長が 3000 文字を超える場合は、ストリーミング出力の使用を推奨します。

リクエストヘッダー

Content-Type
string
必須
列挙値: application/json
Authorization
string
必須
Bearer 認証形式: Bearer {{API Key}}。

リクエストボディ

text
string
必須
音声合成するテキスト。長さは 10000 文字未満に制限されます。テキスト長が 3000 文字を超える場合は、ストリーミング出力の使用を推奨します。段落切り替え(改行文字)、ポーズ制御(&lt;#x#&gt; マーク)、フィラータグ(例: (laughs)、(coughs) など。speech-2.8-hd/turbo のみ対応)をサポートします
stream
boolean
デフォルト:false
ストリーミング出力するかどうかを制御します。デフォルトは false、つまりストリーミングは有効になりません
voice_modify
object
audio_setting
object
output_format
string
デフォルト:"hex"
出力結果の形式を制御するパラメータ。選択可能な値の範囲は url、hex で、デフォルト値は hex です。このパラメータは非ストリーミングのシナリオでのみ有効で、ストリーミングのシナリオでは hex 形式の返却のみサポートされます。返却される url の有効期限は 24 時間です選択可能な値:url, hex
voice_setting
object
aigc_watermark
boolean
デフォルト:false
合成音声の末尾に音声リズム識別子を追加するかどうかを制御します。デフォルト値は false です。このパラメータは非ストリーミング合成でのみ有効です
language_boost
string
指定された少数言語や方言の認識能力を強化するかどうか。デフォルト値は null で、auto に設定するとモデルが自律的に判断します選択可能な値:Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, auto
stream_options
object
timber_weights
array
混合音色設定。最大 4 種類の音色混合に対応しています
subtitle_enable
boolean
デフォルト:false
字幕サービスを有効にするかどうかを制御します。デフォルト値は false です。このパラメータは非ストリーミング出力のシナリオでのみ有効で、かつ speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd モデルにのみ有効です
continuous_sound
boolean
デフォルト:false
このパラメータを有効にすると、節のつなぎ目がより自然になります。speech-2.8-hd と speech-2.8-turbo モデルのみ対応しています
pronunciation_dict
object

レスポンス情報

data
object
返却される合成データオブジェクト。null の可能性があるため、非 null 判定が必要です
trace_id
string
今回のセッションの id。問い合わせ/フィードバック時に問題の特定を支援するために使用します
base_resp
object
今回のリクエストのステータスコードと詳細
extra_info
object
音声の追加情報