Перейти к основному содержанию
POST
/
v3
/
glm-asr
GLM аудио в текст
curl --request POST \
  --url https://api.highwayapi.ai/v3/glm-asr \
  --header 'Authorization: <authorization>' \
  --header 'Content-Type: <content-type>' \
  --data '
{
  "file": "<string>",
  "prompt": "<string>",
  "hotwords": [
    {}
  ]
}
'
{
  "text": "<string>"
}
Используйте модель GLM-ASR-2512 для транскрибирования аудиофайлов в текст, поддерживается многоязычная транскрипция.

Заголовки запроса

Content-Type
string
обязательно
Значения перечисления: application/json
Authorization
string
обязательно
Формат Bearer-аутентификации: Bearer {{API 密钥}}.

Тело запроса

file
string
обязательно
URL аудиофайла для транскрибирования или строка в кодировке Base64. Поддерживаемые форматы аудиофайлов: .wav / .mp3; ограничения: размер файла ≤ 25 MB, длительность аудио ≤ 30 секунд
prompt
string
В сценариях с длинным текстом можно предоставить предыдущие результаты транскрипции в качестве контекста. Рекомендуется менее 8000 символов.
hotwords
array
Список горячих слов, используемый для повышения точности распознавания терминов в определённых областях. Пример формата: [“人名”,“地名”], рекомендуется не более 100 элементов.Длина массива: 0 - 100

Информация об ответе

text
string
Полное содержание транскрипции аудио