ElevenLabs テキスト読み上げ Flash V2.5
音声
ElevenLabs テキスト読み上げ Flash V2.5
POST
ElevenLabs テキスト読み上げ Flash V2.5
選択した音声を使用してテキストを音声に変換し、音声を返します。
リクエストヘッダー
列挙値:
application/jsonBearer 認証形式: Bearer {{API Key}}。
リクエストボディ
指定した場合、システムは可能な限り決定論的にサンプリングします。同じseedおよびパラメータでリクエストを繰り返すと同じ結果が返されるはずですが、完全な決定性は保証されません。値の範囲:[0, 4294967295]
音声に変換するテキスト。
Stream モードを有効にするかどうか
使用する音声ID。
現在のリクエストテキストの後に続くテキスト。複数回の生成をつなぎ合わせる際に音声の一貫性を改善するために使用します。
モデルとテキスト正規化に使用する言語コード(ISO 639-1)。モデルがこの言語コードに対応していない場合、エラーが返されます。
生成される音声の出力形式。形式は codec_sample_rate_bitrate です。MP3の192kbpsビットレートにはCreator以上のアカウントが必要で、PCMの44.1kHzサンプルレートにはPro以上のアカウントが必要です。使用可能な値:
mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192現在のリクエストテキストの前にあるテキスト。複数回の生成をつなぎ合わせる際に音声の一貫性を改善するために使用します。
true の場合、PVCバージョンではなくIVCバージョンの音声を使用します。これはPVCバージョンの遅延が大きいことに対する一時的な回避策です。
後続サンプルのrequest_idリスト。サンプルを再生成する際に音声の一貫性を維持するために使用します。最大3つのrequest_idを渡せます。配列長:0 - 3
現在の生成より前に生成済みのサンプルのrequest_idリスト。音声の一貫性を改善するために使用できます。最大3つのrequest_idを渡せます。配列長:0 - 3
テキスト正規化を制御します。‘auto’ はシステムが判断し、‘on’ は常に正規化し、‘off’ はスキップします。使用可能な値:
auto, on, offより自然な発音を実現するため、対応する一部の言語に対する言語テキスト正規化を制御します。警告:遅延が大幅に増加する可能性があります。現在は日本語のみ対応しています。
テキストに適用する発音辞書ロケーター(id, version_id)のリスト。順番に適用されます。各リクエストで最大3つのロケーターを使用できます。配列長:0 - 3
レスポンス情報
生成された音声ファイル 形式:binary