Fish Audio 音声合成
音声
Fish Audio 音声合成
POST
Fish Audio 音声合成
最良の結果を得るには、この API を使用する前に、まず音声クローンを使用して参照音声をアップロードすることをお勧めします。これにより、音声品質が向上し、レイテンシが低減されます。
-
WAV / PCM
- サンプルレート:8kHz, 16kHz, 24kHz, 32kHz, 44.1kHz
- デフォルトのサンプルレート:44.1kHz
- 16-bit、モノラル
-
MP3
- サンプルレート:32kHz, 44.1kHz
- デフォルトのサンプルレート:44.1kHz
- モノラル
- ビットレート:64kbps, 128kbps (デフォルト), 192kbps
-
Opus
- サンプルレート:48kHz
- デフォルトのサンプルレート:48kHz
- モノラル
- ビットレート:-1000 (自動), 24kbps, 32kbps (デフォルト), 48kbps, 64kbps
リクエストヘッダー
列挙値:
application/jsonBearer 認証形式: Bearer {{API Key}}。
リクエストボディ
音声に変換するテキスト。
音声生成のランダム性を制御します。値が高いほど(例:1.0)出力はよりランダムになり、値が低いほど(例:0.1)より決定的になります。
s1 モデルでは 0.9 の使用をお勧めします。必須範囲:0 <= x <= 1nucleus sampling によって多様性を制御します。値が低いほど(例:0.1)出力はより集中し、値が高いほど(例:1.0)より多様性が許容されます。
s1 モデルでは 0.9 の使用をお勧めします。必須範囲:0 <= x <= 1音声に使用する参照音声です。これには MessagePack シリアライズが必要で、reference_voices と reference_texts を上書きします。
音声に使用する参照モデル ID。
音声に使用する韻律制御。
音声に使用するチャンク長。必須範囲:
100 <= x <= 300音声を正規化するかどうか。これによりレイテンシは低減されますが、数字や日付の処理性能が低下する可能性があります。
音声に使用する形式。選択可能な値:
wav, pcm, mp3, opus音声に使用するサンプルレート。
音声に使用する MP3 ビットレート。選択可能な値:
64, 128, 192音声に使用する Opus ビットレート。選択可能な値:
-1000, 24, 32, 48, 64音声に使用するレイテンシ設定。balanced はレイテンシを低減しますが、性能低下を引き起こす可能性があります。選択可能な値:
normal, balancedレスポンス情報
API はformat パラメータで指定された形式の音声ストリームを直接返します(デフォルト:mp3)。