Cette API prend en charge la génération asynchrone de voix à partir de texte. Une génération de texte unique prend en charge jusqu’à 1 million de caractères transmis, et le résultat audio complet généré peut être récupéré de manière asynchrone. Elle prend en charge plus de 100 voix système et le choix de voix clonées ; elle permet également d’ajuster librement l’intonation, la vitesse, le volume, le débit binaire, la fréquence d’échantillonnage et le format de sortie.Après avoir soumis une requête de synthèse vocale pour un texte long, veuillez noter que l’url renvoyée est valable 24 heures à compter de son renvoi. Veuillez tenir compte du délai de téléchargement des informations.
Convient à la génération vocale de textes longs tels que des livres entiers ; le temps d’attente dans la file de tâches peut être relativement long. Pour des scénarios tels que la génération de phrases courtes, le chat vocal ou les interactions sociales en ligne, il est recommandé d’utiliser l’appel synchrone de synthèse vocale.
Plage [-12,12], valeur par défaut : 0Intonation de la voix générée. Facultatif ; (0 correspond à la sortie de la voix d’origine, la valeur doit être un entier).
Identifiant de la voix demandée.Deux types sont pris en charge : les voix système (id) et les voix clonées (id). Les voix système (ID) sont les suivantes :
Voix de jeune homme ingénu : male-qn-qingse
Voix de jeune homme d’élite : male-qn-jingying
Voix de jeune homme autoritaire : male-qn-badao
Voix de jeune étudiant universitaire : male-qn-daxuesheng
Voix de jeune fille : female-shaonv
Voix de femme mature et dominante : female-yujie
Voix de femme adulte : female-chengshu
Voix de femme douce : female-tianmei
Présentateur masculin : presenter_male
Présentatrice féminine : presenter_female
Livre audio masculin 1 : audiobook_male_1
Livre audio masculin 2 : audiobook_male_2
Livre audio féminin 1 : audiobook_female_1
Livre audio féminin 2 : audiobook_female_2
Voix de jeune homme ingénu-beta : male-qn-qingse-jingpin
Voix de jeune homme d’élite-beta : male-qn-jingying-jingpin
Voix de jeune homme autoritaire-beta : male-qn-badao-jingpin
Voix de jeune étudiant universitaire-beta : male-qn-daxuesheng-jingpin
Voix de jeune fille-beta : female-shaonv-jingpin
Voix de femme mature et dominante-beta : female-yujie-jingpin
Voix de femme adulte-beta : female-chengshu-jingpin
Voix de femme douce-beta : female-tianmei-jingpin
Garçon intelligent : clever_boy
Garçon mignon : cute_boy
Petite fille adorable : lovely_girl
Cochon de dessin animé Xiaoqi : cartoon_pig
Petit frère maladivement attachant : bingjiao_didi
Ce paramètre prend en charge la normalisation du texte anglais, ce qui peut améliorer les performances dans les scénarios de lecture de nombres, mais augmente légèrement la latence. S’il n’est pas fourni, la valeur par défaut est false.
Plage 【32000,64000,128000,256000】Débit binaire de la voix générée. Facultatif, valeur par défaut : 128000. Ce paramètre ne s’applique qu’à l’audio au format mp3.
Remplace les textes, symboles et prononciations correspondantes nécessitant une annotation spéciale.Remplacement de la prononciation (ajustement du ton/remplacement par d’autres prononciations de caractères), au format suivant :["燕少飞/(yan4)(shao3)(fei1)","达菲/(da2)(fei1)","omg/oh my god"]Les tons sont représentés par des nombres : premier ton (yinping) = 1, deuxième ton (yangping) = 2, troisième ton (shangsheng) = 3, quatrième ton (qusheng) = 4, ton neutre = 5.
Renforce la capacité de reconnaissance pour les langues minoritaires et dialectes spécifiés. Après configuration, ce paramètre peut améliorer les performances vocales dans les scénarios correspondant à la langue minoritaire/au dialecte spécifié. Si le type de langue minoritaire n’est pas clairement identifié, vous pouvez choisir “auto” ; le modèle déterminera alors automatiquement le type de langue minoritaire. Les valeurs suivantes sont prises en charge :'Chinese', 'Chinese,Yue', 'English', 'Arabic', 'Russian', 'Spanish', 'French', 'Portuguese', 'German', 'Turkish', 'Dutch', 'Ukrainian', 'Vietnamese', 'Indonesian', 'Japanese', 'Italian', 'Korean', 'Thai', 'Polish', 'Romanian', 'Greek', 'Czech', 'Finnish', 'Hindi', 'Bulgarian', 'Danish', 'Hebrew', 'Malay', 'Persian', 'Slovak', 'Swedish', 'Croatian', 'Filipino', 'Hungarian', 'Norwegian', 'Slovenian', 'Catalan', 'Nynorsk', 'Tamil', 'Afrikaans', 'auto'
Ajustement de la hauteur (grave/clair), plage [-100,100] ; plus la valeur est proche de -100, plus la voix est grave ; plus elle est proche de 100, plus la voix est claire
Ajustement de l’intensité (puissance/douceur), plage [-100,100] ; plus la valeur est proche de -100, plus la voix est ferme ; plus elle est proche de 100, plus la voix est douce
Ajustement du timbre (magnétique/cristallin), plage [-100,100] ; plus la valeur est proche de -100, plus la voix est ronde ; plus elle est proche de 100, plus la voix est cristalline