GLM Áudio para Texto
Áudio
GLM Áudio para Texto
POST
GLM Áudio para Texto
Use o modelo GLM-ASR-2512 para transcrever arquivos de áudio em texto, com suporte a transcrição multilíngue.
Cabeçalhos da solicitação
Valores enumerados:
application/jsonFormato de autenticação Bearer: Bearer {{chave de API}}.
Corpo da solicitação
URL do arquivo de áudio ou string codificada em Base64 a ser transcrita. Formatos de arquivo de áudio compatíveis: .wav / .mp3. Limites de especificação: tamanho do arquivo ≤ 25 MB, duração do áudio ≤ 30 segundos
Em cenários de texto longo, você pode fornecer resultados de transcrição anteriores como contexto. Recomenda-se menos de 8000 caracteres.
Lista de palavras-chave, usada para melhorar a taxa de reconhecimento de vocabulário de domínios específicos. Formato, por exemplo: [“nome de pessoa”,“nome de lugar”]; recomenda-se não exceder 100 itens.Comprimento do array: 0 - 100
Informações da resposta
Conteúdo completo da transcrição do áudio