Синтез речи Fish Audio
Аудио
Синтез речи Fish Audio
POST
Синтез речи Fish Audio
Для достижения наилучших результатов перед использованием этого API рекомендуется сначала загрузить эталонное аудио с помощью клонирования аудио. Это повысит качество речи и снизит задержку.
-
WAV / PCM
- Частота дискретизации: 8kHz, 16kHz, 24kHz, 32kHz, 44.1kHz
- Частота дискретизации по умолчанию: 44.1kHz
- 16-bit, моно
-
MP3
- Частота дискретизации: 32kHz, 44.1kHz
- Частота дискретизации по умолчанию: 44.1kHz
- Моно
- Битрейт: 64kbps, 128kbps (по умолчанию), 192kbps
-
Opus
- Частота дискретизации: 48kHz
- Частота дискретизации по умолчанию: 48kHz
- Моно
- Битрейт: -1000 (авто), 24kbps, 32kbps (по умолчанию), 48kbps, 64kbps
Заголовки запроса
Значение перечисления:
application/jsonФормат аутентификации Bearer: Bearer {{API 密钥}}.
Тело запроса
Текст, который нужно преобразовать в речь.
Управляет случайностью генерации речи. Более высокие значения (например, 1.0) делают вывод более случайным, более низкие значения (например, 0.1) делают его более детерминированным. Для модели
s1 мы рекомендуем использовать 0.9.Обязательный диапазон: 0 <= x <= 1Управляет разнообразием с помощью nucleus sampling. Более низкие значения (например, 0.1) делают вывод более сфокусированным, более высокие значения (например, 1.0) допускают большее разнообразие. Для модели
s1 мы рекомендуем использовать 0.9.Обязательный диапазон: 0 <= x <= 1Эталонное аудио для речи; требуется сериализация MessagePack. Это переопределит reference_voices и reference_texts.
ID эталонной модели для речи.
Управление просодией для речи.
Длина фрагмента для речи.Обязательный диапазон:
100 <= x <= 300Нормализовать ли речь. Это снизит задержку, но может ухудшить обработку чисел и дат.
Формат для речи.Допустимые значения:
wav, pcm, mp3, opusЧастота дискретизации для речи.
Битрейт MP3 для речи.Допустимые значения:
64, 128, 192Битрейт Opus для речи.Допустимые значения:
-1000, 24, 32, 48, 64Настройка задержки для речи; balanced снизит задержку, но может привести к снижению производительности.Допустимые значения:
normal, balancedИнформация об ответе
API напрямую вернет аудиопоток в формате, указанном параметромformat (по умолчанию: mp3).