Saltar al contenido principal
POST
/
v3
/
glm-tts
Síntesis de voz GLM
curl --request POST \
  --url https://api.highwayapi.ai/v3/glm-tts \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "input": "<string>",
  "speed": 123,
  "voice": "<string>",
  "volume": 123,
  "response_format": "<string>",
  "watermark_enabled": true
}
'
Convierte texto en voz natural con GLM-TTS, con soporte para múltiples voces, control de emociones y ajuste de entonación.

Encabezados de solicitud

Content-Type
string
requerido
Valores enumerados: application/json
Authorization
string
requerido
Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

input
string
requerido
Texto que se convertirá en vozLímite de longitud: 0 - 1024
speed
number
predeterminado:1
Velocidad de habla, valor predeterminado 1.0, rango de valores [0.5, 2]Rango de valores: [0.5, 2]
voice
string
predeterminado:"tongtong"
requerido
Timbre de voz utilizado al generar el audio. Admite dos tipos: voces del sistema y voces clonadas. Las voces del sistema incluyen: tongtong (Tongtong, voz predeterminada), chuichui (Chuichui), xiaochen (Xiaochen), jam (voz jam de Dongdong Animal Circle), kazi (voz kazi de Dongdong Animal Circle), douji (voz douji de Dongdong Animal Circle), luodo (voz luodo de Dongdong Animal Circle)
volume
number
predeterminado:1
Volumen, valor predeterminado 1.0, rango de valores (0, 10]Rango de valores: [0, 10]
response_format
string
predeterminado:"pcm"
Formato de salida de audio; de forma predeterminada se devuelve un archivo en formato pcmValores opcionales: wav, pcm
watermark_enabled
boolean
Controla si se añade una marca de agua al audio generado por IA. true: habilita de forma predeterminada la marca de agua explícita generada por IA y la marca de agua digital implícita, cumpliendo con los requisitos de la política. false: desactiva todas las marcas de agua; solo tiene efecto para usuarios que ya hayan completado el proceso de eliminación de marca de agua.

Información de respuesta

Procesamiento empresarial correcto; se recomienda establecer la frecuencia de muestreo en 24000 Formato: binary