GLM Audio a texto
Audio
GLM Audio a texto
POST
GLM Audio a texto
Usa el modelo GLM-ASR-2512 para transcribir archivos de audio a texto, con soporte para transcripción multilingüe.
Encabezados de solicitud
Valores enumerados:
application/jsonFormato de autenticación Bearer: Bearer {{clave de API}}.
Cuerpo de la solicitud
URL del archivo de audio que se debe transcribir o cadena codificada en Base64. Formatos de archivo de audio compatibles: .wav / .mp3. Límites de especificación: tamaño de archivo ≤ 25 MB, duración de audio ≤ 30 segundos
En escenarios de texto largo, puedes proporcionar resultados de transcripción anteriores como contexto. Se recomienda que sea inferior a 8000 caracteres.
Lista de palabras clave, utilizada para mejorar la tasa de reconocimiento de vocabulario de dominios específicos. Formato, por ejemplo: [“nombre de persona”,“nombre de lugar”]; se recomienda no superar 100.Longitud del array: 0 - 100
Información de respuesta
Contenido completo de la transcripción de audio