MiniMax Speech 2.8 HD synchrone Sprachsynthese
Audio
MiniMax Speech 2.8 HD synchrone Sprachsynthese
POST
MiniMax Speech 2.8 HD synchrone Sprachsynthese
Konvertiert Text in Sprache und unterstützt verschiedene Stimmen, Emotionssteuerung, Anpassung der Sprechgeschwindigkeit und weitere Funktionen. Die Textlänge ist auf weniger als 10000 Zeichen begrenzt. Wenn die Textlänge mehr als 3000 Zeichen beträgt, wird die Verwendung von Streaming-Ausgabe empfohlen.
Anfrage-Header
Enumerationswert:
application/jsonBearer-Authentifizierungsformat: Bearer {{API Key}}.
Anfragekörper
Der Text, der in Sprache synthetisiert werden soll. Die Länge ist auf weniger als 10000 Zeichen begrenzt. Wenn die Textlänge mehr als 3000 Zeichen beträgt, wird die Verwendung von Streaming-Ausgabe empfohlen. Unterstützt Absatzwechsel (Zeilenumbrüche), Pausensteuerung (
<#x#>-Markierung) und Interjektions-/Paralinguistik-Tags (z. B. (laughs), (coughs) usw.; nur von speech-2.8-hd/turbo unterstützt)Steuert, ob Streaming-Ausgabe verwendet wird. Standardmäßig false, d. h. Streaming ist nicht aktiviert
Parameter zur Steuerung des Ausgabeformats. Mögliche Werte sind url und hex, Standardwert ist hex. Dieser Parameter ist nur in nicht gestreamten Szenarien wirksam; Streaming-Szenarien unterstützen nur die Rückgabe im hex-Format. Die zurückgegebene url ist 24 Stunden gültigMögliche Werte:
url, hexSteuert, ob am Ende der synthetisierten Audiodatei eine Audio-Rhythmuskennung hinzugefügt wird. Standardwert ist false. Dieser Parameter ist nur für nicht gestreamte Synthese wirksam
Gibt an, ob die Erkennungsfähigkeit für bestimmte weniger verbreitete Sprachen und Dialekte verbessert werden soll. Standardwert ist null; kann auf auto gesetzt werden, damit das Modell selbstständig entscheidetMögliche Werte:
Chinese, Chinese,Yue, English, Arabic, Russian, Spanish, French, Portuguese, German, Turkish, Dutch, Ukrainian, Vietnamese, Indonesian, Japanese, Italian, Korean, Thai, Polish, Romanian, Greek, Czech, Finnish, Hindi, Bulgarian, Danish, Hebrew, Malay, Persian, Slovak, Swedish, Croatian, Filipino, Hungarian, Norwegian, Slovenian, Catalan, Nynorsk, Tamil, Afrikaans, autoEinstellung für gemischte Stimmen; unterstützt die Mischung von maximal 4 Stimmen
Steuert, ob der Untertiteldienst aktiviert wird. Standardwert ist false. Dieser Parameter ist nur in Szenarien mit nicht gestreamter Ausgabe gültig und nur für die Modelle speech-2.6-hd, speech-2.6-turbo, speech-02-turbo, speech-02-hd, speech-01-turbo, speech-01-hd wirksam
Aktivieren Sie diesen Parameter, damit Übergänge zwischen Teilsätzen natürlicher klingen. Unterstützt nur die Modelle speech-2.8-hd und speech-2.8-turbo
Antwortinformationen
Zurückgegebenes Synthesedatenobjekt; kann null sein und muss auf Nicht-Null geprüft werden
id dieser Sitzung; hilft bei Anfragen/Feedback, das Problem zu lokalisieren
Statuscode und Details dieser Anfrage
Zusätzliche Informationen zur Audiodatei