GLM Áudio para Texto - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-asr \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "file": "<string>", "prompt": "<string>", "hotwords": [ {} ] } '

Use o modelo GLM-ASR-2512 para transcrever arquivos de áudio em texto, com suporte a transcrição multilíngue.

Cabeçalhos da solicitação

Content-Type

string

obrigatório

Valores enumerados: application/json

Authorization

string

obrigatório

Formato de autenticação Bearer: Bearer {{chave de API}}.

Corpo da solicitação

file

string

obrigatório

URL do arquivo de áudio ou string codificada em Base64 a ser transcrita. Formatos de arquivo de áudio compatíveis: .wav / .mp3. Limites de especificação: tamanho do arquivo ≤ 25 MB, duração do áudio ≤ 30 segundos

prompt

string

Em cenários de texto longo, você pode fornecer resultados de transcrição anteriores como contexto. Recomenda-se menos de 8000 caracteres.

hotwords

array

Lista de palavras-chave, usada para melhorar a taxa de reconhecimento de vocabulário de domínios específicos. Formato, por exemplo: [“nome de pessoa”,“nome de lugar”]; recomenda-se não exceder 100 itens.Comprimento do array: 0 - 100

Informações da resposta

text

string

Conteúdo completo da transcrição do áudio

​Cabeçalhos da solicitação

​Corpo da solicitação

​Informações da resposta

Cabeçalhos da solicitação

Corpo da solicitação

Informações da resposta