Síntese de fala GLM
Áudio
Síntese de fala GLM
POST
Síntese de fala GLM
Use o GLM-TTS para converter texto em fala natural, com suporte a várias vozes, controle de emoção e ajustes de entonação.
Cabeçalhos da requisição
Valores enumerados:
application/jsonFormato de autenticação Bearer: Bearer {{API Key}}.
Corpo da requisição
Texto a ser convertido em falaLimite de comprimento: 0 - 1024
Velocidade da fala, padrão 1.0, intervalo de valores [0.5, 2]Intervalo de valores: [0.5, 2]
Timbre usado ao gerar o áudio, com suporte a dois tipos: timbres do sistema e timbres clonados. Os timbres do sistema incluem: tongtong(Tongtong, timbre padrão), chuichui(Chuichui), xiaochen(Xiaochen), jam(timbre jam do Dongdong Animal Circle), kazi(timbre kazi do Dongdong Animal Circle), douji(timbre douji do Dongdong Animal Circle), luodo(timbre luodo do Dongdong Animal Circle)
Volume, padrão 1.0, intervalo de valores (0, 10]Intervalo de valores: [0, 10]
Formato de saída de áudio; por padrão, retorna um arquivo no formato pcmValores opcionais:
wav, pcmControla se uma marca d’água é adicionada ao áudio gerado por AI. true: ativa por padrão a marca d’água explícita gerada por AI e a marca d’água digital implícita, em conformidade com os requisitos da política. false: desativa todas as marcas d’água, válido apenas para usuários que já concluíram o processo de remoção de marca d’água.
Informações de resposta
Processamento de negócio bem-sucedido; recomenda-se definir a taxa de amostragem como 24000 Formato:binary