Síntesis de voz GLM
Audio
Síntesis de voz GLM
POST
Síntesis de voz GLM
Convierte texto en voz natural con GLM-TTS, con soporte para múltiples voces, control de emociones y ajuste de entonación.
Encabezados de solicitud
Valores enumerados:
application/jsonFormato de autenticación Bearer: Bearer {{API Key}}.
Cuerpo de la solicitud
Texto que se convertirá en vozLímite de longitud: 0 - 1024
Velocidad de habla, valor predeterminado 1.0, rango de valores [0.5, 2]Rango de valores: [0.5, 2]
Timbre de voz utilizado al generar el audio. Admite dos tipos: voces del sistema y voces clonadas. Las voces del sistema incluyen: tongtong (Tongtong, voz predeterminada), chuichui (Chuichui), xiaochen (Xiaochen), jam (voz jam de Dongdong Animal Circle), kazi (voz kazi de Dongdong Animal Circle), douji (voz douji de Dongdong Animal Circle), luodo (voz luodo de Dongdong Animal Circle)
Volumen, valor predeterminado 1.0, rango de valores (0, 10]Rango de valores: [0, 10]
Formato de salida de audio; de forma predeterminada se devuelve un archivo en formato pcmValores opcionales:
wav, pcmControla si se añade una marca de agua al audio generado por IA. true: habilita de forma predeterminada la marca de agua explícita generada por IA y la marca de agua digital implícita, cumpliendo con los requisitos de la política. false: desactiva todas las marcas de agua; solo tiene efecto para usuarios que ya hayan completado el proceso de eliminación de marca de agua.
Información de respuesta
Procesamiento empresarial correcto; se recomienda establecer la frecuencia de muestreo en 24000 Formato:binary