Synthèse vocale asynchrone MiniMax Speech 2.8 Turbo
Audio
Synthèse vocale asynchrone MiniMax Speech 2.8 Turbo
POST
Synthèse vocale asynchrone MiniMax Speech 2.8 Turbo
Utilisez cette interface pour créer une tâche de synthèse vocale asynchrone. Les entrées texte ou fichier sont prises en charge : le texte est limité à 50 000 caractères maximum, et les fichiers à 100 000 caractères maximum.
En-têtes de requête
Valeur d’énumération :
application/jsonFormat d’authentification Bearer : Bearer {{API Key}}.
Corps de la requête
Texte de l’audio à synthétiser, limité à 50 000 caractères maximum. L’un des champs
• Balises d’interjections : uniquement lorsque le modèle sélectionné est
text ou text_file_id est obligatoire• Balises d’interjections : uniquement lorsque le modèle sélectionné est
speech-2.8-hd ou speech-2.8-turbo, l’insertion de balises d’interjections dans le texte est prise en charge. Interjections prises en charge : (laughs) (rire), (chuckle) (petit rire), (coughs) (toux), (clear-throat) (raclement de gorge), (groans) (gémissement), (breath) (respiration normale), (pant) (halètement), (inhale) (inspiration), (exhale) (expiration), (gasps) (inspiration brusque), (sniffs) (reniflement), (sighs) (soupir), (snorts) (souffle nasal), (burps) (rot), (lip-smacking) (claquement de lèvres), (humming) (fredonnement), (hissing) (sifflement), (emm) (euh), (whistles) (sifflement), (sneezes) (éternuement), (crying) (sanglot), (applause) (applaudissements)ID du fichier texte de l’audio à synthétiser. La longueur d’un fichier unique doit être inférieure à 100 000 caractères. Formats de fichier pris en charge : txt, zip. L’un des champs
• Fichier txt : longueur limitée à <100,000 caractères. L’utilisation de
• Fichier zip :
• L’archive compressée doit contenir des fichiers txt ou json du même format.
• Format du fichier json : les trois champs [
text ou text_file_id est obligatoire ; une fois fourni, le format est automatiquement vérifié.• Fichier txt : longueur limitée à <100,000 caractères. L’utilisation de
<#x#> pour marquer des pauses personnalisées est prise en charge. x correspond à la durée de la pause (en secondes), dans la plage [0.01,99.99], avec au maximum deux décimales. Notez que la pause doit être placée entre deux segments de texte pouvant être prononcés vocalement ; il n’est pas possible d’utiliser plusieurs marqueurs de pause consécutifs• Fichier zip :
• L’archive compressée doit contenir des fichiers txt ou json du même format.
• Format du fichier json : les trois champs [
title, content, extra] sont pris en charge et représentent respectivement le titre, le corps du texte et les informations supplémentaires. Si les trois champs existent, 3 groupes de résultats sont produits, soit 9 fichiers au total, stockés ensemble dans un même dossier. Si un champ n’existe pas ou si son contenu est vide, aucun résultat correspondant à ce champ ne sera généréContrôle l’ajout d’un identifiant rythmique audio à la fin de l’audio synthétisé. Valeur par défaut : False. Ce paramètre ne s’applique qu’à la synthèse non diffusée en streaming
Indique s’il faut renforcer la capacité de reconnaissance pour les langues minoritaires et dialectes spécifiés. La valeur par défaut est
null ; vous pouvez la définir sur auto pour laisser le modèle décider automatiquement.Valeurs disponibles : Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, autoActivez ce paramètre pour rendre les transitions entre propositions plus naturelles. Pris en charge uniquement par les modèles
speech-2.8-hd et speech-2.8-turboInformations de réponse
ID du fichier audio correspondant renvoyé après la création réussie de la tâche.
• Une fois la tâche terminée, il peut être utilisé pour effectuer une requête via file_id. Lorsque la requête échoue, ce champ n’est pas renvoyéRemarque : l’URL de téléchargement renvoyée est valide pendant 9 heures (32400 secondes) à compter de sa génération. Une fois expirée, le fichier deviendra invalide et les informations générées seront perdues ; veillez à télécharger les informations à temps
• Une fois la tâche terminée, il peut être utilisé pour effectuer une requête via file_id. Lorsque la requête échoue, ce champ n’est pas renvoyéRemarque : l’URL de téléchargement renvoyée est valide pendant 9 heures (32400 secondes) à compter de sa génération. Une fois expirée, le fichier deviendra invalide et les informations générées seront perdues ; veillez à télécharger les informations à temps
Utilisez task_id pour appeler l’API de requête du résultat de tâche afin de récupérer la sortie générée.
Informations de clé utilisées pour terminer la tâche actuelle
Nombre de caractères facturés