Síntesis de voz GLM - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-tts \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "input": "<string>", "speed": 123, "voice": "<string>", "volume": 123, "response_format": "<string>", "watermark_enabled": true } '

Convierte texto en voz natural con GLM-TTS, con soporte para múltiples voces, control de emociones y ajuste de entonación.

Encabezados de solicitud

Content-Type

string

requerido

Valores enumerados: application/json

Authorization

string

requerido

Formato de autenticación Bearer: Bearer {{API Key}}.

Cuerpo de la solicitud

input

string

requerido

Texto que se convertirá en vozLímite de longitud: 0 - 1024

speed

number

predeterminado:1

Velocidad de habla, valor predeterminado 1.0, rango de valores [0.5, 2]Rango de valores: [0.5, 2]

voice

string

predeterminado:"tongtong"

requerido

Timbre de voz utilizado al generar el audio. Admite dos tipos: voces del sistema y voces clonadas. Las voces del sistema incluyen: tongtong (Tongtong, voz predeterminada), chuichui (Chuichui), xiaochen (Xiaochen), jam (voz jam de Dongdong Animal Circle), kazi (voz kazi de Dongdong Animal Circle), douji (voz douji de Dongdong Animal Circle), luodo (voz luodo de Dongdong Animal Circle)

volume

number

predeterminado:1

Volumen, valor predeterminado 1.0, rango de valores (0, 10]Rango de valores: [0, 10]

response_format

string

predeterminado:"pcm"

Formato de salida de audio; de forma predeterminada se devuelve un archivo en formato pcmValores opcionales: wav, pcm

watermark_enabled

boolean

Controla si se añade una marca de agua al audio generado por IA. true: habilita de forma predeterminada la marca de agua explícita generada por IA y la marca de agua digital implícita, cumpliendo con los requisitos de la política. false: desactiva todas las marcas de agua; solo tiene efecto para usuarios que ya hayan completado el proceso de eliminación de marca de agua.

Información de respuesta

Procesamiento empresarial correcto; se recomienda establecer la frecuencia de muestreo en 24000 Formato: binary

​Encabezados de solicitud

​Cuerpo de la solicitud

​Información de respuesta

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta