Passer au contenu principal
POST
/
v3
/
async
/
minimax-speech-2.5-turbo-preview
Synthèse vocale asynchrone MiniMax Speech-2.5-turbo-preview
curl --request POST \
  --url https://api.highwayapi.ai/v3/async/minimax-speech-2.5-turbo-preview \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "text": "<string>",
  "voice_setting": {
    "speed": 123,
    "vol": 123,
    "pitch": 123,
    "voice_id": "<string>",
    "emotion": "<string>",
    "text_normalization": true
  },
  "audio_setting": {
    "sample_rate": 123,
    "bitrate": 123,
    "format": "<string>",
    "channel": 123
  },
  "pronunciation_dict": {
    "tone": [
      {}
    ]
  },
  "language_boost": "<string>",
  "voice_modify": {
    "pitch": 123,
    "intensity": 123,
    "timbre": 123,
    "sound_effects": "<string>"
  }
}
'
{
  "task_id": "<string>"
}
Cette API prend en charge la génération asynchrone de synthèse vocale à partir de texte. Une seule requête de génération de texte peut transmettre jusqu’à 1 million de caractères, et le résultat audio complet généré peut être récupéré de manière asynchrone. Elle prend en charge plus de 100 voix système ainsi que des voix clonées au choix ; elle permet également d’ajuster librement l’intonation, la vitesse, le volume, le débit binaire, la fréquence d’échantillonnage et le format de sortie. Après avoir soumis une demande de synthèse vocale pour un texte long, notez que l’url renvoyée est valide pendant 24 heures à compter de son retour. Veillez à télécharger les informations dans les délais.
Convient à la génération vocale de textes longs, comme des livres entiers. Le temps d’attente en file de tâches peut être relativement long. Pour les scénarios tels que la génération de phrases courtes, les conversations vocales ou les interactions sociales en ligne, il est recommandé d’utiliser l’appel synchrone de synthèse vocale.

En-têtes de requête

Content-Type
string
requis
Valeur énumérée : application/json
Authorization
string
requis
Format d’authentification Bearer : Bearer {{API Key}}.

Corps de la requête

text
string
requis
Texte à synthétiser, limité à 50 000 caractères maximum.
voice_setting
object
requis
audio_setting
object
pronunciation_dict
object
language_boost
string
défaut:"null"
Renforce la capacité de reconnaissance pour les langues minoritaires et dialectes spécifiés, et peut améliorer la performance vocale dans les scénarios correspondant à ces langues/dialectes après configuration. Si le type de langue minoritaire n’est pas clair, vous pouvez choisir “auto” ; le modèle déterminera alors automatiquement le type de langue minoritaire. Les valeurs suivantes sont prises en charge :'Chinese', 'Chinese,Yue', 'English', 'Arabic', 'Russian', 'Spanish', 'French', 'Portuguese', 'German', 'Turkish', 'Dutch', 'Ukrainian', 'Vietnamese', 'Indonesian', 'Japanese', 'Italian', 'Korean', 'Thai', 'Polish', 'Romanian', 'Greek', 'Czech', 'Finnish', 'Hindi', 'Bulgarian', 'Danish', 'Hebrew', 'Malay', 'Persian', 'Slovak', 'Swedish', 'Croatian', 'Filipino', 'Hungarian', 'Norwegian', 'Slovenian', 'Catalan', 'Nynorsk', 'Tamil', 'Afrikaans', 'auto'
voice_modify
object
Paramètres d’effet vocal. Formats audio pris en charge par ce paramètre : mp3, wav, flac

Paramètres des informations de réponse

task_id
string
requis
task_id de la tâche asynchrone. Vous devez utiliser ce task_id pour demander l’API de consultation du résultat de tâche afin d’obtenir le résultat généré.