Servir efficacement les LLM

Servir efficacement les LLM

Instructeur : Travis Addair

Projet

Développez des compétences professionnelles recherchées grâce à des instructions étape par étape

niveau Intermédiaire

Expérience recommandée

1 heure

Apprenez à votre propre rythme

Un apprentissage pratique

Projet

Développez des compétences professionnelles recherchées grâce à des instructions étape par étape

niveau Intermédiaire

Expérience recommandée

1 heure

Apprenez à votre propre rythme

Un apprentissage pratique

Ce que vous apprendrez

Découvrez comment les Grands modèles de langage (LLM) prédisent de manière répétée le prochain mot et comment des techniques telles que la mise en cache KV peuvent accélérer considérablement la génération de texte.
Code pour un service d'application LLM efficace, équilibrant la vitesse de sortie du modèle et le service de plusieurs utilisateurs à la fois.
Explorez les principes fondamentaux des adaptateurs de bas rang et découvrez comment Predibase construit son serveur d'inférence pour servir des modèles affinés en une seule fois.

Détails à connaître

Enseigné en Anglais

Aucun téléchargement ou installation requis(e)

Disponible uniquement sur ordinateur

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

En savoir plus sur Coursera pour les affaires

Apprendre, pratiquer et appliquer des compétences prêtes à l'emploi en moins de 2 heures

Bénéficiez d’une formation par des experts du secteur
Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel

À propos de ce projet

Rejoignez notre nouvelle formation courte, Efficiently Serving Large Language Models, pour acquérir une compréhension de base de la manière de servir les applications LLM par Travis Addair, CTO chez Predibase. Que vous soyez prêt à lancer votre propre application ou que vous commenciez à la construire, les sujets que vous explorerez dans ce cours approfondiront votre connaissance fondamentale du fonctionnement des LLM et vous aideront à mieux comprendre les compromis de performance que vous devez prendre en compte lors de la construction d'applications LLM qui serviront un grand nombre d'utilisateurs. Vous passerez en revue les optimisations les plus importantes qui permettent aux fournisseurs de LLM de servir efficacement des modèles à de nombreux clients, y compris des stratégies pour travailler avec plusieurs modèles affinés à la fois. Dans ce cours, vous : 1. Apprendre comment les modèles génératifs de langage (LLM) auto-régressifs génèrent du texte un jeton à la fois. 2. Implémenter les éléments fondamentaux d'une pile d'inférence LLM moderne dans le code, y compris la mise en cache KV, la mise en lot continue et la quantification de modèle, et comparer leurs impacts sur le débit et la latence de l'inférence. 3. Explorer les détails du fonctionnement des adaptateurs LoRA et apprendre comment les techniques de batching permettent à différents adaptateurs LoRA d'être servis à plusieurs clients simultanément. 4. Mettre la main sur le serveur d'inférence LoRAX de Predibase pour voir ces techniques d'optimisation mises en œuvre dans un serveur d'inférence LLM réel. En savoir plus sur le fonctionnement des serveurs LLM sous le capot améliorera grandement votre compréhension des options dont vous disposez pour augmenter la performance et l'efficacité de vos applications alimentées par LLM.

Instructeur

Travis Addair

DeepLearning.AI

1 Cours464 apprenants

Offert par

DeepLearning.AI

Méthode d’apprentissage

Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.

Étudiant(e) depuis 2018

’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’

Jennifer J.

Étudiant(e) depuis 2020

’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’

Larry W.

Étudiant(e) depuis 2021

’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’

Chaitanya A.

’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Vous aimerez peut-être aussi

Coursera Instructor Network
Understanding Large Language Models in Business
Cours
NIIT
RESTful Microservices Using Node.js and Express
Spécialisation
DeepLearning.AI
Build LLM Apps with LangChain.js
Cours
DeepLearning.AI
Data Pipelines with TensorFlow Data Services
Cours

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Découvrir les diplômes

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions

Dans les projets, vous réaliserez une activité ou un scénario en suivant un ensemble d’instructions au sein d’un environnement pratique et interactif. Les projets sont réalisés dans un environnement Cloud réel et dans des instances réelles de divers produits, plutôt que dans un environnement de simulation ou de démonstration.

En achetant un projet, vous obtenez tout ce dont vous avez besoin pour terminer ce projet, y compris un accès temporaire à tout produit nécessaire pour terminer le projet.

Même si les Projets sont techniquement disponibles sur les appareils mobiles, nous vous conseillons vivement d’effectuer les projets sur un ordinateur portable ou de bureau uniquement.