Capacités des modèles
Un grand modèle de langage (LLM) est un modèle d’intelligence artificielle fondé sur l’apprentissage profond et les technologies de traitement du langage naturel. Entraîné sur de vastes volumes de données textuelles, il peut comprendre, générer et traiter le langage humain. Il dispose principalement des capacités suivantes :- Génération de texte Peut générer du contenu textuel cohérent sur le plan logique à partir du contexte, et ajuster le style de sortie selon les besoins.
- Compréhension du langage Peut comprendre précisément le sens du texte saisi et prendre en charge des conversations en tenant compte du contexte.
- Traduction de texte Dispose de capacités de génération et de compréhension multilingues, permettant la traduction de texte entre différentes langues.
- Questions-réponses basées sur les connaissances Possède une vaste base de connaissances et peut répondre à des questions dans divers domaines tels que la culture, les sciences et l’histoire.
- Compréhension et génération de code Peut comprendre et générer du code (par exemple Python, Java, C++, etc.), détecter des erreurs de code et fournir des suggestions de code.
- Classification et résumé de texte Peut comprendre des phrases complexes, classer et extraire des informations, et extraire les points clés d’un texte pour produire automatiquement un résumé.
Choix du modèle
Sur JieKou AI, vous pouvez consulter la liste des grands modèles de langage pris en charge par la plateforme, ainsi que leurs présentations générales, leurs tarifs et d’autres informations. Cliquez sur un modèle spécifique pour ouvrir sa page de détails et l’essayer en ligne selon vos besoins. Après l’avoir suffisamment testé dans le cadre de tâches concrètes, vous pouvez comparer les performances des modèles et choisir celui qui convient le mieux.Appel d’API
JieKou AI fournit un service d’API compatible avec le standard OpenAI API, ce qui facilite son intégration dans vos applications existantes.- ChatCompletion, prenant en charge le mode streaming et le mode standard.
- Completion, prenant en charge le mode streaming et le mode standard.
https://api.highwayapi.ai/openai, d’obtenir et de configurer votre clé API, puis de mettre à jour le nom du modèle selon vos besoins pour accéder au service d’API des grands modèles de langage.
Exemples de code
Python
Curl
Paramètres clés
Paramètres de base
model : le modèle à appeler. Vous pouvez consulter la liste des grands modèles de langage pris en charge par la plateforme sur JieKou AI.
Rôles des messages
S’applique uniquement à ChatCompletion.
messages : les entrées et sorties lors de l’interaction avec le grand modèle. Chaque message appartient à un rôle. Les messages peuvent vous aider à obtenir de meilleures sorties ; vous pouvez essayer différentes approches afin d’obtenir de meilleurs résultats.
content: contenu du message.role: rôle de l’auteur du message.system: définit le rôle de l’IA et indique au modèle le rôle ou le comportement à adopter.user: texte fourni au modèle par l’utilisateur.assistant: réponse générée par le modèle. L’utilisateur peut également préremplir des exemples pour indiquer au modèle comment répondre à la requête actuelle.
name: facultatif, permet de distinguer les auteurs de messages ayant le même rôle.
Prompt
S’applique uniquement à Completion.
prompt : l’invite utilisée pour générer la complétion. Il s’agit des informations textuelles fournies par l’utilisateur au grand modèle de langage, afin d’indiquer clairement au modèle le problème à résoudre ou la tâche à accomplir. C’est également la base qui permet au modèle de comprendre le besoin et de générer un contenu pertinent et précis.
Contrôle de la génération
Différentes combinaisons de paramètres permettent au modèle de générer un contenu plus conforme à des besoins spécifiques. Diversité du textetemperatureettop_ppeuvent tous deux contrôler la diversité du texte généré. Il est recommandé de ne définir qu’une seule de ces valeurs. Plus la valeur définie est élevée, plus le texte généré est diversifié. Plus la valeur est faible, plus le texte généré est déterministe.
temperature: température d’échantillonnage, ajuste le caractère aléatoire du texte généré.top_p: échantillonnage par noyau, contrôle la probabilité cumulée des mots candidats.top_k: limite le nombre de mots candidats.
presence_penalty: pénalité de présence, contrôle le degré de répétition du contenu lorsque le modèle génère du texte. Si un Token est déjà apparu dans le texte, il sera pénalisé, ce qui pousse le modèle à introduire davantage de nouveaux Token.frequency_penalty: pénalité de probabilité, contrôle la fréquence d’apparition de certains mots dans le texte généré. Elle pénalise un Token à chaque apparition dans le texte, réduisant ainsi la probabilité qu’il soit généré à l’avenir et empêchant le modèle de réutiliser les mêmes Token.repetition_penalty: valeur de pénalité de répétition, utilisée pour limiter ou encourager les répétitions.
Limites de sortie
max_tokens: nombre maximal de Token retournés pour une requête unique. Si le nombre de Token générés par le modèle dépasse la valeur demax_tokens, le contenu retourné sera tronqué.stream: contrôle si la sortie est diffusée en streaming. Pour certains modèles qui produisent un volume important de contenu, il est recommandé d’activer la sortie en streaming afin d’éviter les sorties trop longues pouvant entraîner un délai d’expiration.true: sortie en streaming, c’est-à-dire génération et sortie simultanées ; le modèle renvoie un fragment à chaque fois qu’il génère une partie du contenu.false: le modèle renvoie le résultat en une seule fois après avoir généré tout le contenu.
stop: caractère de terminaison. Lorsque le texte généré par le modèle contient la chaîne définie parstop, le modèle arrête la sortie.