Zum Hauptinhalt springen

Aufruffrequenzsteuerung verstehen

Die Aufruffrequenzsteuerung legt fest, wie viele API-Anfragen innerhalb eines bestimmten Zeitraums gestellt werden können, und hilft dabei, die API-Nutzung zu optimieren.
  • Verhindert Missbrauch und Fehlgebrauch der API
  • Stellt eine faire Ressourcenverteilung sicher
  • Erhält die Leistung und Zuverlässigkeit der API
  • Schützt die Stabilität des Dienstes

Standardmäßige Aufruffrequenzsteuerung

Für jedes Konto gelten beim Aufruf von Modellen standardmäßige Rate Limits, die jeweils in RPM (Anfragen pro Modell pro Minute) und TPM (Token pro Modell pro Minute) gemessen werden. Die Rate Limits unterscheiden sich je nach Kontostufe. Die genauen Kriterien finden Sie in der folgenden Tabelle.
Quota-StufeQualifikation (Einheit: US-Dollar)
T1Höchster monatlicher Gesamtaufladebetrag in den letzten 3 Kalendermonaten < $50
T2$50 ≤ höchster monatlicher Gesamtaufladebetrag in den letzten 3 Kalendermonaten < $500
T3$500 ≤ höchster monatlicher Gesamtaufladebetrag in den letzten 3 Kalendermonaten < $3000
T4$3000 ≤ höchster monatlicher Gesamtaufladebetrag in den letzten 3 Kalendermonaten < $10000
T5$10000 ≤ höchster monatlicher Gesamtaufladebetrag in den letzten 3 Kalendermonaten
Standardmäßige Rate Limits der einzelnen Stufen (RPM / TPM):

Vermeiden, die Aufruffrequenzsteuerung auszulösen

Wenn die Anzahl Ihrer API-Anfragen die Aufruffrequenzsteuerung überschreitet, gibt die API Folgendes zurück:
  • HTTP-Statuscode: 429 (Zu viele Anfragen).
  • Im Antworttext werden Informationen zur überschrittenen Aufruffrequenz zurückgegeben.
Um zu vermeiden, die Aufruffrequenzsteuerung auszulösen, können Sie folgende Maßnahmen ergreifen:
  • Implementieren Sie eine Anfragenbegrenzung in Ihrer Anwendung.
  • Verwenden Sie beim Wiederholen von Anfragen einen exponentiellen Backoff-Mechanismus.
  • Überwachen Sie Ihre API-Nutzung.

Umgang mit 429-Fehlern

Wenn Sie einen 429-Fehler erhalten, können Sie Folgendes versuchen:
  • Später erneut versuchen: Warten Sie eine Weile und versuchen Sie Ihre Anfrage dann erneut.
  • Anfrage optimieren: Reduzieren Sie die Anfragefrequenz.
  • Aufruffrequenzsteuerung erhöhen: Wenn Sie eine höhere Aufruffrequenzsteuerung benötigen, können Sie uns kontaktieren.