MiniMax 音声クイック複製
音声
MiniMax 音声クイック複製
POST
MiniMax 音声クイック複製
本インターフェースは、モノラル・ステレオ音声の複製に対応しており、指定した音声ファイルに基づいて同じ音色の音声を迅速に複製できます。
本インターフェースで生成されるクイック複製音色は一時的な音色です。特定の複製音色を永続的に保持したい場合は、168 時間(7 日)以内に任意の T2A 音声合成インターフェースでその音色を呼び出してください(本インターフェース内の試聴行為は含まれません)。そうしない場合、その音色は削除されます。
本インターフェースの適用シーン:IP 複製、音色クローンなど、特定の音色を迅速に複製する必要がある関連シーン。
説明:
- アップロードする音声ファイル形式は、mp3、m4a、wav 形式である必要があります。
- アップロードする音声ファイルの長さは、最短 10 秒以上、最長 5 分以下である必要があります。
- アップロードする音声ファイルのサイズは 20mb を超えてはなりません。
リクエストヘッダー
列挙値:
application/jsonBearer 認証形式: Bearer {{API Key}}。
リクエストボディ
音色を複製する音声ファイルの url。mp3、m4a、wav 形式に対応しています。
clone_prompt
音色複製パラメータ。本パラメータを指定すると、音声合成の音色類似度と安定性の向上に役立ちます。本パラメータを使用する場合は、短いサンプル音声(長さ 8s 未満)と、その音声に対応するテキストを同時にアップロードする必要があります。音声は mp3、m4a、wav 形式に対応しています。
複製試聴パラメータ。モデルは複製後の音色でこのテキスト内容を読み上げ、音声合成結果をリンク形式で返します。複製効果の試聴に使用できます。2000 文字以内に制限されます。注:試聴は文字数に応じて通常どおり音声合成料金が発生し、価格は T2A の各インターフェースと同一です。
複製試聴パラメータ。試聴に使用する音声モデルを指定します。“text” フィールドを渡す場合、このフィールドは必須です。
選択肢:
選択肢:
speech-02-hd, speech-02-turbo, speech-2.5-hd-preview, speech-2.5-turbo-preview, speech-2.8-hd, speech-2.8-turbo音声複製パラメータ。値の範囲は [0,1] です。このフィールドをアップロードすると、テキスト検証の精度しきい値が設定されます。指定しない場合、このフィールドのデフォルト値は 0.7 です。
音声複製パラメータ。ノイズリダクションを有効にするかどうか。指定しない場合、デフォルトは false です。
音声複製パラメータ。音量正規化を有効にするかどうか。指定しない場合、デフォルトは false です。
レスポンス情報
リクエストボディに試聴テキスト text および試聴モデル model が渡された場合、本パラメータは試聴音声をリンク形式で返します。
生成された voice_id