Pular para o conteúdo principal
POST
/
v3
/
glm-tts
Síntese de fala GLM
curl --request POST \
  --url https://api.highwayapi.ai/v3/glm-tts \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "input": "<string>",
  "speed": 123,
  "voice": "<string>",
  "volume": 123,
  "response_format": "<string>",
  "watermark_enabled": true
}
'
Use o GLM-TTS para converter texto em fala natural, com suporte a várias vozes, controle de emoção e ajustes de entonação.

Cabeçalhos da requisição

Content-Type
string
obrigatório
Valores enumerados: application/json
Authorization
string
obrigatório
Formato de autenticação Bearer: Bearer {{API Key}}.

Corpo da requisição

input
string
obrigatório
Texto a ser convertido em falaLimite de comprimento: 0 - 1024
speed
number
padrão:1
Velocidade da fala, padrão 1.0, intervalo de valores [0.5, 2]Intervalo de valores: [0.5, 2]
voice
string
padrão:"tongtong"
obrigatório
Timbre usado ao gerar o áudio, com suporte a dois tipos: timbres do sistema e timbres clonados. Os timbres do sistema incluem: tongtong(Tongtong, timbre padrão), chuichui(Chuichui), xiaochen(Xiaochen), jam(timbre jam do Dongdong Animal Circle), kazi(timbre kazi do Dongdong Animal Circle), douji(timbre douji do Dongdong Animal Circle), luodo(timbre luodo do Dongdong Animal Circle)
volume
number
padrão:1
Volume, padrão 1.0, intervalo de valores (0, 10]Intervalo de valores: [0, 10]
response_format
string
padrão:"pcm"
Formato de saída de áudio; por padrão, retorna um arquivo no formato pcmValores opcionais: wav, pcm
watermark_enabled
boolean
Controla se uma marca d’água é adicionada ao áudio gerado por AI. true: ativa por padrão a marca d’água explícita gerada por AI e a marca d’água digital implícita, em conformidade com os requisitos da política. false: desativa todas as marcas d’água, válido apenas para usuários que já concluíram o processo de remoção de marca d’água.

Informações de resposta

Processamento de negócio bem-sucedido; recomenda-se definir a taxa de amostragem como 24000 Formato: binary