メインコンテンツへスキップ
POST
/
v3
/
async
/
minimax-speech-2.6-turbo
MiniMax Speech-2.6-turbo 非同期音声合成
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.6-turbo \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "voice_setting": {
    "speed": 123,
    "vol": 123,
    "pitch": 123,
    "voice_id": "<string>",
    "emotion": "<string>",
    "text_normalization": true
  },
  "audio_setting": {
    "sample_rate": 123,
    "bitrate": 123,
    "format": "<string>",
    "channel": 123
  },
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  },
  "language_boost": "<string>",
  "voice_modify": {
    "pitch": 123,
    "intensity": 123,
    "timbre": 123,
    "sound_effects": "<string>"
  }
}
'
{
  "task_id": "<string>"
}
この API は、テキストから音声への非同期生成に対応しています。1 回のテキスト生成送信で最大 100 万文字をサポートし、生成された完全な音声結果は非同期で取得できます。100 種類以上のシステム音色、クローン音色を自由に選択でき、イントネーション、話速、音量、ビットレート、サンプリングレート、出力形式も自由に調整できます。 長文の音声合成リクエストを送信した後、返される url の有効期限は url が返されてから 24 時間である点に注意し、ダウンロード情報の時間にご注意ください。
書籍全体などの長文テキストの音声生成に適しています。タスクのキュー待ちに時間がかかる場合があります。短文生成、音声チャット、オンラインソーシャルなどのシーンでは、同期呼び出し音声合成 の利用を推奨します。

リクエストヘッダー

Content-Type
string
必須
列挙値: application/json
Authorization
string
必須
Bearer 認証形式: Bearer {{API Key}}。

リクエストボディ

text
string
必須
合成するテキスト。最大 5 万文字に制限されます。
voice_setting
object
必須
audio_setting
object
pronunciation_dict
object
language_boost
string
デフォルト:"null"
指定した少数言語や方言の認識能力を強化し、設定後は指定した少数言語/方言シーンでの音声表現を向上できます。少数言語の種類が明確でない場合は、“auto” を選択できます。モデルが少数言語の種類を自動で判断します。以下の値をサポートしています:'Chinese', 'Chinese,Yue', 'English', 'Arabic', 'Russian', 'Spanish', 'French', 'Portuguese', 'German', 'Turkish', 'Dutch', 'Ukrainian', 'Vietnamese', 'Indonesian', 'Japanese', 'Italian', 'Korean', 'Thai', 'Polish', 'Romanian', 'Greek', 'Czech', 'Finnish', 'Hindi', 'Bulgarian', 'Danish', 'Hebrew', 'Malay', 'Persian', 'Slovak', 'Swedish', 'Croatian', 'Filipino', 'Hungarian', 'Norwegian', 'Slovenian', 'Catalan', 'Nynorsk', 'Tamil', 'Afrikaans', 'auto'
voice_modify
object
音声エフェクター設定。このパラメータがサポートする音声形式:mp3, wav, flac

レスポンス情報パラメータ

task_id
string
必須
非同期タスクの task_id。この task_id を使用して タスク結果照会 API をリクエストし、生成結果を取得する必要があります