GLM 音声文字起こし - 接口AI 文档中心

curl --request POST \ --url https://api.highwayapi.ai/v3/glm-asr \ --header 'Authorization: <authorization>' \ --header 'Content-Type: <content-type>' \ --data ' { "file": "<string>", "prompt": "<string>", "hotwords": [ {} ] } '

GLM-ASR-2512 モデルを使用して音声ファイルをテキストに文字起こしします。多言語の文字起こしに対応しています。

リクエストヘッダー

Content-Type

string

必須

列挙値: application/json

Authorization

string

必須

Bearer 認証形式: Bearer {{API キー}}。

リクエストボディ

file

string

必須

文字起こしする音声ファイルのURLまたはBase64エンコード文字列。対応する音声ファイル形式：.wav / .mp3、仕様制限：ファイルサイズ ≤ 25 MB、音声長 ≤ 30 秒

prompt

string

長文のシナリオでは、以前の文字起こし結果をコンテキストとして提供できます。8000文字未満を推奨します。

hotwords

array

ホットワードリスト。特定分野の語彙認識率を向上させるために使用します。形式例：[“人名”,“地名”]、100個以下を推奨します。配列の長さ：0 - 100

レスポンス情報

text

string

音声文字起こしの完全な内容

​リクエストヘッダー

​リクエストボディ

​レスポンス情報

リクエストヘッダー

リクエストボディ

レスポンス情報