Synthèse vocale synchrone MiniMax Speech 2.8 Turbo
Audio
Synthèse vocale synchrone MiniMax Speech 2.8 Turbo
POST
Synthèse vocale synchrone MiniMax Speech 2.8 Turbo
Convertit du texte en parole, avec prise en charge de plusieurs timbres, du contrôle des émotions, du réglage de la vitesse d’élocution, etc. La longueur du texte doit être inférieure à 10000 caractères. Si la longueur du texte dépasse 3000 caractères, il est recommandé d’utiliser la sortie en streaming.
En-têtes de requête
Valeur énumérée :
application/jsonFormat d’authentification Bearer : Bearer {{clé API}}.
Corps de la requête
Texte à synthétiser en parole. La longueur doit être inférieure à 10000 caractères. Si la longueur du texte dépasse 3000 caractères, il est recommandé d’utiliser la sortie en streaming. Prend en charge les changements de paragraphe (sauts de ligne), le contrôle des pauses (marqueur
<#x#>) et les balises d’interjections/sons vocaux (comme (laughs), (coughs), etc., uniquement prises en charge par speech-2.8-hd/turbo)Contrôle l’activation de la sortie en streaming. La valeur par défaut est false, c’est-à-dire que le streaming n’est pas activé
Paramètre contrôlant le format du résultat de sortie. Les valeurs possibles sont url et hex, valeur par défaut hex. Ce paramètre ne prend effet que dans les scénarios non streaming ; en streaming, seul le retour au format hex est pris en charge. L’url retournée est valable 24 heuresValeurs possibles :
url, hexContrôle l’ajout d’un marqueur rythmique audio à la fin de l’audio synthétisé, valeur par défaut false. Ce paramètre ne prend effet que pour la synthèse non streaming
Indique s’il faut renforcer la capacité de reconnaissance pour les langues minoritaires et dialectes spécifiés. La valeur par défaut est null ; vous pouvez définir auto pour laisser le modèle déterminer automatiquementValeurs possibles :
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, autoParamètre de timbre mixte, avec prise en charge du mélange de 4 timbres au maximum
Contrôle l’activation du service de sous-titres, valeur par défaut false. Ce paramètre n’est valide que dans les scénarios de sortie non streaming et uniquement pour les modèles speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd
Activez ce paramètre pour rendre les transitions entre sous-phrases plus naturelles. Pris en charge uniquement par les modèles speech-2.8-hd et speech-2.8-turbo
Informations de réponse
Objet de données de synthèse retourné, qui peut être null et doit donc faire l’objet d’une vérification de non-nullité
id de cette session, utilisé pour aider à localiser le problème lors d’une demande d’assistance ou d’un retour
Code d’état et détails de cette requête
Informations supplémentaires de l’audio