メインコンテンツへスキップ
POST
/
v3
/
async
/
minimax-speech-2.5-turbo-preview
MiniMax Speech-2.5-turbo-preview 非同期音声合成
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.5-turbo-preview \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "voice_setting": {
    "speed": 123,
    "vol": 123,
    "pitch": 123,
    "voice_id": "<string>",
    "emotion": "<string>",
    "text_normalization": true
  },
  "audio_setting": {
    "sample_rate": 123,
    "bitrate": 123,
    "format": "<string>",
    "channel": 123
  },
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  },
  "language_boost": "<string>",
  "voice_modify": {
    "pitch": 123,
    "intensity": 123,
    "timbre": 123,
    "sound_effects": "<string>"
  }
}
'
{
  "task_id": "<string>"
}
この API は、テキストから音声への非同期生成をサポートしています。1 回のテキスト生成リクエストで最大 100 万文字まで送信でき、生成された完全な音声結果は非同期で取得できます。100 種類以上のシステム音色およびクローン音色を自由に選択でき、イントネーション、話速、音量、ビットレート、サンプリングレート、出力形式も自由に調整できます。 長文の音声合成リクエストを送信した後は、返却される url の有効期限が url 返却開始から 24 時間である点に注意し、期限内に情報をダウンロードしてください。
書籍全体などの長文テキストの音声生成に適しています。タスクのキュー待ちに時間がかかる場合があります。短文生成、音声チャット、オンラインソーシャルなどのシーンでは、同期呼び出し音声合成の使用を推奨します。

リクエストヘッダー

Content-Type
string
必須
列挙値: application/json
Authorization
string
必須
Bearer 認証形式: Bearer {{API キー}}。

リクエストボディ

text
string
必須
合成対象のテキスト。最大 5 万文字まで。
voice_setting
object
必須
audio_setting
object
pronunciation_dict
object
language_boost
string
デフォルト:"null"
指定した少数言語および方言の認識能力を強化します。設定後、指定した少数言語/方言シーンでの音声表現を向上できます。少数言語の種類が不明な場合は、“auto” を選択できます。モデルが少数言語の種類を自動的に判断します。以下の値をサポートしています:'Chinese', 'Chinese,Yue', 'English', 'Arabic', 'Russian', 'Spanish', 'French', 'Portuguese', 'German', 'Turkish', 'Dutch', 'Ukrainian', 'Vietnamese', 'Indonesian', 'Japanese', 'Italian', 'Korean', 'Thai', 'Polish', 'Romanian', 'Greek', 'Czech', 'Finnish', 'Hindi', 'Bulgarian', 'Danish', 'Hebrew', 'Malay', 'Persian', 'Slovak', 'Swedish', 'Croatian', 'Filipino', 'Hungarian', 'Norwegian', 'Slovenian', 'Catalan', 'Nynorsk', 'Tamil', 'Afrikaans', 'auto'
voice_modify
object
音声エフェクター設定。このパラメータがサポートする音声形式:mp3, wav, flac

レスポンス情報パラメータ

task_id
string
必須
非同期タスクの task_id。この task_id を使用して タスク結果照会 API をリクエストし、生成結果を取得してください