Zum Hauptinhalt springen
POST
/
v3
/
glm-tts
GLM-Sprachsynthese
curl --request POST \
  --url https://api.highwayapi.ai/v3/glm-tts \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "input": "<string>",
  "speed": 123,
  "voice": "<string>",
  "volume": 123,
  "response_format": "<string>",
  "watermark_enabled": true
}
'
Verwenden Sie GLM-TTS, um Text in natürlich klingende Sprache umzuwandeln, mit Unterstützung für verschiedene Stimmen, Emotionssteuerung und Anpassung der Intonation.

Anfrageheader

Content-Type
string
erforderlich
Enumerationswert: application/json
Authorization
string
erforderlich
Bearer-Authentifizierungsformat: Bearer {{API Key}}。

Anfragetext

input
string
erforderlich
Der Text, der in Sprache umgewandelt werden sollLängenbeschränkung: 0 - 1024
speed
number
Standard:1
Sprechgeschwindigkeit, Standardwert 1.0, Wertebereich [0.5, 2]Wertebereich: [0.5, 2]
voice
string
Standard:"tongtong"
erforderlich
Die Stimme, die beim Generieren des Audios verwendet wird. Es werden zwei Arten unterstützt: Systemstimmen und geklonte Stimmen. Zu den Systemstimmen gehören: tongtong (彤彤, Standardstimme), chuichui (锤锤), xiaochen (小陈), jam (动动动物圈 jam-Stimme), kazi (动动动物圈 kazi-Stimme), douji (动动动物圈 douji-Stimme), luodo (动动动物圈 luodo-Stimme)
volume
number
Standard:1
Lautstärke, Standardwert 1.0, Wertebereich (0, 10]Wertebereich: [0, 10]
response_format
string
Standard:"pcm"
Audio-Ausgabeformat; standardmäßig wird eine Datei im pcm-Format zurückgegebenOptionale Werte: wav, pcm
watermark_enabled
boolean
Steuert, ob beim Generieren von Audio durch KI ein Wasserzeichen hinzugefügt wird. true: Standardmäßig werden explizite KI-Wasserzeichen und implizite digitale Wasserzeichen aktiviert, um den Richtlinienanforderungen zu entsprechen. false: Deaktiviert alle Wasserzeichen; dies ist nur für Benutzer wirksam, die den Vorgang zur Wasserzeichenentfernung abgeschlossen haben.

Antwortinformationen

Bei erfolgreicher Geschäftsverarbeitung wird empfohlen, die Abtastrate auf 24000 zu setzen Format: binary