Modellfähigkeiten
Große Sprachmodelle (LLMs) sind KI-Modelle, die auf Deep Learning und Technologien zur Verarbeitung natürlicher Sprache basieren. Nach dem Training mit großen Mengen an Textdaten können sie menschliche Sprache verstehen, generieren und verarbeiten. Sie verfügen hauptsächlich über folgende Fähigkeiten:- Textgenerierung Sie können auf Grundlage des Kontexts logisch zusammenhängende Textinhalte generieren und den Ausgabestil bei Bedarf anpassen.
- Sprachverständnis Sie können die Bedeutung eingegebener Texte präzise verstehen und kontextbezogene Dialoge unterstützen.
- Textübersetzung Sie verfügen über die Fähigkeit zur sprachübergreifenden Generierung und zum sprachübergreifenden Verständnis und können Textübersetzungen zwischen verschiedenen Sprachen umsetzen.
- Wissensbasierte Fragen und Antworten Sie verfügen über umfangreiche Wissensbestände und können Fragen aus Bereichen wie Kultur, Wissenschaft, Geschichte und vielen weiteren beantworten.
- Codeverständnis und Codegenerierung Sie können Code verstehen und generieren (z. B. Python, Java, C++ usw.), Codefehler erkennen und Codevorschläge bereitstellen.
- Textklassifizierung und Zusammenfassung Sie können komplexe Sätze verstehen, Informationen klassifizieren und extrahieren sowie die wichtigsten Punkte eines Textes für automatische Zusammenfassungen extrahieren.
Modellauswahl
Unter JieKou AI können Sie die Liste der von der Plattform unterstützten großen Sprachmodelle einsehen und grundlegende Informationen, Preise und weitere Details zu den Modellen erfahren. Wenn Sie auf ein bestimmtes Modell klicken, wird die Detailseite geöffnet, auf der Sie es bei Bedarf online ausprobieren können. Nachdem Sie ein Modell ausführlich anhand konkreter Aufgaben getestet haben, können Sie die Modellleistung vergleichen und das passende Modell auswählen.API-Aufruf
JieKou AI bietet API-Dienste, die mit dem OpenAI-API-Standard kompatibel sind, sodass Sie diese bequem in bestehende Anwendungen integrieren können.- ChatCompletion, unterstützt den Streaming-Modus und den regulären Modus.
- Completion, unterstützt den Streaming-Modus und den regulären Modus.
https://api.highwayapi.ai/openai setzen, Ihren API-Schlüssel abrufen und konfigurieren sowie bei Bedarf den Modellnamen aktualisieren, um auf den API-Dienst für große Sprachmodelle zuzugreifen.
Codebeispiele
Python
Curl
Wichtige Parameter
Basisparameter
model: Das aufzurufende Modell. Unter JieKou AI können Sie die Liste der von der Plattform unterstützten großen Sprachmodelle einsehen.
Nachrichtenrollen
Gilt nur für ChatCompletion.
messages: Die Ein- und Ausgaben bei der Interaktion mit dem großen Modell. Jede Nachricht gehört zu einer Rolle. Nachrichten können Ihnen helfen, bessere Ausgaben zu erhalten. Sie können verschiedene Ansätze ausprobieren, um bessere Ergebnisse zu erzielen.
content: Nachrichteninhalt.role: Die Rolle des Nachrichtenautors.system: Legt die KI-Rolle fest und teilt dem Modell mit, welche Rolle oder welches Verhalten es annehmen soll.user: Der vom Benutzer an das Modell eingegebene Text.assistant: Die vom Modell generierte Antwort. Benutzer können auch vorab Beispiele ausfüllen, um dem Modell mitzuteilen, wie es auf die aktuelle Anfrage reagieren soll.
name: Optional, dient zur Unterscheidung von Nachrichtenautoren mit derselben Rolle.
Prompt
Gilt nur für Completion.
prompt: Der Prompt zur Generierung der Vervollständigung. Dies sind die Textinformationen, die der Benutzer in das große Sprachmodell eingibt, um dem Modell klar mitzuteilen, welches Problem gelöst oder welche Aufgabe abgeschlossen werden soll. Zugleich bildet dies die Grundlage dafür, dass das Modell die Anforderungen versteht und relevante, präzise Inhalte generiert.
Generierung steuern
Verschiedene Parameterkombinationen können dafür sorgen, dass das Modell Inhalte generiert, die spezifischen Anforderungen besser entsprechen. TextvielfaltSowohltemperatureals auchtop_pkönnen die Vielfalt des generierten Textes steuern. Es wird empfohlen, nur einen der beiden Werte festzulegen. Je größer der festgelegte Wert ist, desto vielfältiger ist der generierte Text. Je kleiner der Wert ist, desto deterministischer ist der generierte Text.
temperature: Sampling-Temperatur, passt die Zufälligkeit des generierten Textes an.top_p: Nucleus Sampling, steuert die kumulative Wahrscheinlichkeit der Kandidatenwörter.top_k: Begrenzt die Anzahl der Kandidatenwörter.
presence_penalty: Präsenzstrafe, steuert den Wiederholungsgrad von Inhalten bei der Textgenerierung durch das Modell. Wenn ein Token bereits im Text vorkommt, wird es bestraft, wodurch das Modell eher neue Token einführt.frequency_penalty: Häufigkeitsstrafe, steuert die Auftretenshäufigkeit bestimmter Wörter im generierten Text. Token werden jedes Mal bestraft, wenn sie im Text vorkommen, wodurch die Wahrscheinlichkeit sinkt, dass diese Token künftig generiert werden, und verhindert wird, dass das Modell dieselben Token wiederholt verwendet.repetition_penalty: Wiederholungsstrafe, dient zum Unterdrücken oder Fördern von Wiederholungen.
Ausgabebeschränkungen
max_tokens: Die maximale Anzahl an Token, die bei einer einzelnen Anfrage zurückgegeben wird. Wenn die Anzahl der vom Modell generierten Token den Wert vonmax_tokensüberschreitet, wird der abgeschnittene Inhalt zurückgegeben.stream: Steuert, ob die Ausgabe als Stream erfolgt. Für Modelle mit umfangreicheren Ausgaben wird empfohlen, Streaming-Ausgabe zu verwenden, um zu verhindern, dass zu lange Ausgaben zu einem Timeout führen.true: Streaming-Ausgabe, d. h. Ausgabe während der Generierung. Das Modell gibt jedes Mal ein Fragment zurück, wenn es einen Teil des Inhalts generiert.false: Das Modell gibt das Ergebnis einmalig zurück, nachdem alle Inhalte generiert wurden.
stop: Stoppzeichen. Wenn der vom Modell generierte Text die instopfestgelegte Zeichenkette enthält, beendet das Modell die Ausgabe.