GLM Audio a texto - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-asr \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "file": "<string>", "prompt": "<string>", "hotwords": [ {} ] } '

Usa el modelo GLM-ASR-2512 para transcribir archivos de audio a texto, con soporte para transcripción multilingüe.

Encabezados de solicitud

Content-Type

string

requerido

Valores enumerados: application/json

Authorization

string

requerido

Formato de autenticación Bearer: Bearer {{clave de API}}.

Cuerpo de la solicitud

file

string

requerido

URL del archivo de audio que se debe transcribir o cadena codificada en Base64. Formatos de archivo de audio compatibles: .wav / .mp3. Límites de especificación: tamaño de archivo ≤ 25 MB, duración de audio ≤ 30 segundos

prompt

string

En escenarios de texto largo, puedes proporcionar resultados de transcripción anteriores como contexto. Se recomienda que sea inferior a 8000 caracteres.

hotwords

array

Lista de palabras clave, utilizada para mejorar la tasa de reconocimiento de vocabulario de dominios específicos. Formato, por ejemplo: [“nombre de persona”,“nombre de lugar”]; se recomienda no superar 100.Longitud del array: 0 - 100

Información de respuesta

text

string

Contenido completo de la transcripción de audio

​Encabezados de solicitud

​Cuerpo de la solicitud

​Información de respuesta

Encabezados de solicitud

Cuerpo de la solicitud

Información de respuesta