Rejoignez notre nouvelle formation courte, Efficiently Serving Large Language Models, pour acquérir une compréhension de base de la manière de servir les applications LLM par Travis Addair, CTO chez Predibase. Que vous soyez prêt à lancer votre propre application ou que vous commenciez à la construire, les sujets que vous explorerez dans ce cours approfondiront votre connaissance fondamentale du fonctionnement des LLM et vous aideront à mieux comprendre les compromis de performance que vous devez prendre en compte lors de la construction d'applications LLM qui serviront un grand nombre d'utilisateurs. Vous passerez en revue les optimisations les plus importantes qui permettent aux fournisseurs de LLM de servir efficacement des modèles à de nombreux clients, y compris des stratégies pour travailler avec plusieurs modèles affinés à la fois. Dans ce cours, vous : 1. Apprendre comment les modèles génératifs de langage (LLM) auto-régressifs génèrent du texte un jeton à la fois. 2. Implémenter les éléments fondamentaux d'une pile d'inférence LLM moderne dans le code, y compris la mise en cache KV, la mise en lot continue et la quantification de modèle, et comparer leurs impacts sur le débit et la latence de l'inférence. 3. Explorer les détails du fonctionnement des adaptateurs LoRA et apprendre comment les techniques de batching permettent à différents adaptateurs LoRA d'être servis à plusieurs clients simultanément. 4. Mettre la main sur le serveur d'inférence LoRAX de Predibase pour voir ces techniques d'optimisation mises en œuvre dans un serveur d'inférence LLM réel. En savoir plus sur le fonctionnement des serveurs LLM sous le capot améliorera grandement votre compréhension des options dont vous disposez pour augmenter la performance et l'efficacité de vos applications alimentées par LLM.
Expérience recommandée
Ce que vous apprendrez
Découvrez comment les Grands modèles de langage (LLM) prédisent de manière répétée le prochain mot et comment des techniques telles que la mise en cache KV peuvent accélérer considérablement la génération de texte.
Code pour un service d'application LLM efficace, équilibrant la vitesse de sortie du modèle et le service de plusieurs utilisateurs à la fois.
Explorez les principes fondamentaux des adaptateurs de bas rang et découvrez comment Predibase construit son serveur d'inférence pour servir des modèles affinés en une seule fois.
Compétences que vous pratiquerez
- Catégorie : Python (langage de programmation)
- Catégorie : LLM
Détails à connaître
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Apprendre, pratiquer et appliquer des compétences prêtes à l'emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel
À propos de ce projet
Instructeur
Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Vous aimerez peut-être aussi
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Dans les projets, vous réaliserez une activité ou un scénario en suivant un ensemble d’instructions au sein d’un environnement pratique et interactif. Les projets sont réalisés dans un environnement Cloud réel et dans des instances réelles de divers produits, plutôt que dans un environnement de simulation ou de démonstration.
En achetant un projet, vous obtenez tout ce dont vous avez besoin pour terminer ce projet, y compris un accès temporaire à tout produit nécessaire pour terminer le projet.
Même si les Projets sont techniquement disponibles sur les appareils mobiles, nous vous conseillons vivement d’effectuer les projets sur un ordinateur portable ou de bureau uniquement.