GLM аудио в текст - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-asr \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "file": "<string>", "prompt": "<string>", "hotwords": [ {} ] } '

Используйте модель GLM-ASR-2512 для транскрибирования аудиофайлов в текст, поддерживается многоязычная транскрипция.

Заголовки запроса

Content-Type

string

обязательно

Значения перечисления: application/json

Authorization

string

обязательно

Формат Bearer-аутентификации: Bearer {{API 密钥}}.

Тело запроса

file

string

обязательно

URL аудиофайла для транскрибирования или строка в кодировке Base64. Поддерживаемые форматы аудиофайлов: .wav / .mp3; ограничения: размер файла ≤ 25 MB, длительность аудио ≤ 30 секунд

prompt

string

В сценариях с длинным текстом можно предоставить предыдущие результаты транскрипции в качестве контекста. Рекомендуется менее 8000 символов.

hotwords

array

Список горячих слов, используемый для повышения точности распознавания терминов в определённых областях. Пример формата: [“人名”,“地名”], рекомендуется не более 100 элементов.Длина массива: 0 - 100

Информация об ответе

text

string

Полное содержание транскрипции аудио

​Заголовки запроса

​Тело запроса

​Информация об ответе

Заголовки запроса

Тело запроса

Информация об ответе