ElevenLabs texte vers parole Turbo V2.5
Audio
ElevenLabs texte vers parole Turbo V2.5
POST
ElevenLabs texte vers parole Turbo V2.5
Convertit du texte en parole avec la voix de votre choix et renvoie l’audio.
En-têtes de requête
Valeur d’énumération :
application/jsonFormat d’authentification Bearer : Bearer {{API Key}}.
Corps de la requête
Si spécifié, le système tentera d’échantillonner de manière déterministe. Des requêtes répétées avec le même seed et les mêmes paramètres devraient renvoyer le même résultat, mais le déterminisme complet n’est pas garanti.Plage de valeurs : [0, 4294967295]
Le texte à convertir en parole.
L’ID de la voix à utiliser.
Le texte qui suit le texte de la requête actuelle. Utilisé pour améliorer la cohérence vocale lors de l’assemblage de plusieurs générations.
Code de langue (ISO 639-1) utilisé pour le modèle et la normalisation du texte. Si le modèle ne prend pas en charge ce code de langue, une erreur sera renvoyée.
Format de sortie de l’audio généré. Le format est codec_sample_rate_bitrate. Le débit binaire MP3 de 192 kbps nécessite un compte Creator ou supérieur, et la fréquence d’échantillonnage PCM de 44,1 kHz nécessite un compte Pro ou supérieur.Valeurs possibles :
mp3_22050_32, mp3_24000_48, mp3_44100_32, mp3_44100_64, mp3_44100_96, mp3_44100_128, mp3_44100_192, pcm_8000, pcm_16000, pcm_22050, pcm_24000, pcm_32000, pcm_44100, pcm_48000, ulaw_8000, alaw_8000, opus_48000_32, opus_48000_64, opus_48000_96, opus_48000_128, opus_48000_192Le texte qui précède le texte de la requête actuelle. Utilisé pour améliorer la cohérence vocale lors de l’assemblage de plusieurs générations.
Si true, utilise la version IVC de la voix au lieu de la version PVC. Il s’agit d’une solution temporaire pour la latence plus élevée de la version PVC.
Liste des request_id des échantillons suivants. Utilisée pour maintenir la cohérence vocale lors de la régénération d’échantillons. Vous pouvez transmettre jusqu’à 3 request_id.Longueur du tableau : 0 - 3
Liste des request_id des échantillons déjà générés avant la génération actuelle. Peut être utilisée pour améliorer la cohérence vocale. Vous pouvez transmettre jusqu’à 3 request_id.Longueur du tableau : 0 - 3
Contrôle la normalisation du texte. ‘auto’ laisse le système décider, ‘on’ normalise toujours, et ‘off’ l’ignore.Valeurs possibles :
auto, on, offContrôle la normalisation linguistique du texte pour certaines langues prises en charge afin d’obtenir une prononciation plus naturelle. Avertissement : cela peut augmenter considérablement la latence. Actuellement, seul le japonais est pris en charge.
Liste des localisateurs de dictionnaire de prononciation (id, version_id) à appliquer au texte. Ils prennent effet dans l’ordre. Chaque requête peut contenir jusqu’à 3 localisateurs.Longueur du tableau : 0 - 3
Informations de réponse
Fichier audio généré Format :binary