GLM 音声文字起こし
音声
GLM 音声文字起こし
POST
GLM 音声文字起こし
GLM-ASR-2512 モデルを使用して音声ファイルをテキストに文字起こしします。多言語の文字起こしに対応しています。
リクエストヘッダー
列挙値:
application/jsonBearer 認証形式: Bearer {{API キー}}。
リクエストボディ
文字起こしする音声ファイルのURLまたはBase64エンコード文字列。対応する音声ファイル形式:.wav / .mp3、仕様制限:ファイルサイズ ≤ 25 MB、音声長 ≤ 30 秒
長文のシナリオでは、以前の文字起こし結果をコンテキストとして提供できます。8000文字未満を推奨します。
ホットワードリスト。特定分野の語彙認識率を向上させるために使用します。形式例:[“人名”,“地名”]、100個以下を推奨します。配列の長さ:0 - 100
レスポンス情報
音声文字起こしの完全な内容