Les modèles IA génératifs, comme les grands modèles de langage, dépassent souvent les capacités du matériel grand public et sont coûteux à exécuter. La compression des modèles par des méthodes telles que la quantification les rend plus efficaces, plus rapides et plus accessibles. Cela leur permet de s'exécuter sur une grande variété d'appareils, y compris les smartphones, les ordinateurs personnels et les appareils périphériques, et de minimiser la dégradation des performances.Rejoignez ce cours pour : 1. Quantifier n'importe quel modèle Open Source avec la quantification linéaire en utilisant la bibliothèque Quanto. 2. Obtenir une vue d'ensemble de la façon dont la quantification linéaire est mise en œuvre. Cette forme de quantification peut être appliquée pour compresser n'importe quel modèle, y compris les LLM, les modèles de vision, etc. 3. Appliquer la "downcasting", une autre forme de quantification, avec la bibliothèque Transformers, qui vous permet de charger des modèles dans environ la moitié de leur taille normale dans le type de données BFloat16. À la fin de ce cours, vous aurez une base dans les techniques de quantification et serez en mesure de les appliquer pour compresser et optimiser vos propres modèles IA génératifs, ce qui les rendra plus accessibles et efficaces.
Expérience recommandée
Ce que vous apprendrez
Apprenez à compresser des modèles avec la bibliothèque Hugging Face Transformers et la bibliothèque Quanto.
Découvrez la quantification linéaire, une méthode simple mais efficace pour compresser les modèles.
Pratique de la quantification de modèles multimodaux et linguistiques Open Source.
Compétences que vous pratiquerez
- Catégorie : IA générative
- Catégorie : Grand modèle de langage (LLM)
Détails à connaître
mai 2024
Disponible uniquement sur ordinateur
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Apprendre, pratiquer et appliquer des compétences prêtes à l'emploi en moins de 2 heures
- Bénéficiez d’une formation par des experts du secteur
- Gagnez en expérience pratique en effectuant des tâches professionnelles du monde réel
À propos de ce projet
Instructeurs
Offert par
Méthode d’apprentissage
Apprentissage pratique basé sur des projets
Mettez en pratique de nouvelles compétences en effectuant des tâches professionnelles à l’aide d’instructions étape par étape.
Aucun téléchargement ou installation requis(e)
Accédez aux outils et aux ressources dont vous avez besoin dans un environnement cloud.
Disponible uniquement sur ordinateur de bureau
Ce projet est conçu pour les ordinateurs portables ou de bureau disposant d’une connexion internet fiable, et non pour les appareils mobiles.
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Dans les projets, vous réaliserez une activité ou un scénario en suivant un ensemble d’instructions au sein d’un environnement pratique et interactif. Les projets sont réalisés dans un environnement Cloud réel et dans des instances réelles de divers produits, plutôt que dans un environnement de simulation ou de démonstration.
En achetant un projet, vous obtenez tout ce dont vous avez besoin pour terminer ce projet, y compris un accès temporaire à tout produit nécessaire pour terminer le projet.
Même si les Projets sont techniquement disponibles sur les appareils mobiles, nous vous conseillons vivement d’effectuer les projets sur un ordinateur portable ou de bureau uniquement.