University of Colorado Boulder
Introduction à l'apprentissage automatique : Apprentissage supervisé
University of Colorado Boulder

Introduction à l'apprentissage automatique : Apprentissage supervisé

Ce cours fait partie de Spécialisation Apprentissage automatique : Théorie et pratique avec Python

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

Geena Kim

Instructeur : Geena Kim

13 748 déjà inscrits

Inclus avec Coursera Plus

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

3.3

(55 avis)

niveau Intermédiaire

Expérience recommandée

39 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme
Progresser pour obtenir un diplôme

Ce que vous apprendrez

  • Utilisez des outils modernes d'apprentissage automatique et des bibliothèques python.

  • Comparez les forces et les faiblesses de la régression logistique.

  • Expliquez comment traiter des données linéairement inséparables.

  • Expliquez ce qu'est un arbre de décision et comment il divise les nœuds.

Compétences que vous acquerrez

  • Catégorie : Hyperparamètre
  • Catégorie : sklearn
  • Catégorie : assemblage
  • Catégorie : Arbre de décision

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

9 quizzes

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

3.3

(55 avis)

niveau Intermédiaire

Expérience recommandée

39 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme
Progresser pour obtenir un diplôme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Apprentissage automatique : Théorie et pratique avec Python
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 6 modules dans ce cours

Cette semaine, nous allons construire notre base d'apprentissage automatique supervisé. Le nettoyage des données et l'AED peuvent ne pas sembler glamour, mais le processus est vital pour guider vos projets de données du monde réel. Il y a de fortes chances que vous ayez déjà entendu parler de la régression linéaire. Avec l'engouement pour l'apprentissage automatique, il peut sembler surprenant que nous commencions par une technique statistique aussi standard. Dans "How Not to Be Wrong : The Power of Mathematical Thinking", Jordan Ellenberg qualifie la régression linéaire de "technique statistique qui est aux sciences sociales ce que le tournevis est aux réparations domestiques. C'est le seul outil que vous utiliserez, quelle que soit la tâche à accomplir" (51). La régression linéaire est un excellent point de départ pour résoudre les problèmes dont le résultat est continu. Nous espérons que cette semaine vous aidera à apprécier tout ce que vous pouvez accomplir avec un modèle aussi simple que celui-ci.

Inclus

5 vidéos12 lectures4 quizzes1 devoir de programmation1 évaluation par les pairs2 sujets de discussion

Cette semaine, nous nous appuyons sur les bases de la semaine dernière pour travailler avec des modèles de régression linéaire plus complexes. Après cette semaine, vous serez en mesure de créer des modèles linéaires avec plusieurs variables explicatives et catégorielles. D'un point de vue mathématique et syntaxique, les modèles de régression linéaire multiple sont une extension naturelle des modèles de régression linéaire plus simples que nous avons appris la semaine dernière. L'une des différences que nous devons garder à l'esprit cette semaine est que notre espace de données est désormais en 3D et non plus en 2D. La différence entre 3D et 2D a des implications sur la façon de créer des visualisations significatives. Il est essentiel de comprendre comment interpréter les coefficients. L'apprentissage automatique implique une itération stratégique et l'amélioration d'un modèle. Dans le laboratoire et l'évaluation par les pairs de cette semaine, vous identifierez les faiblesses des modèles de régression linéaire et les améliorerez de manière stratégique. Nous espérons qu'au fur et à mesure que vous progresserez dans ce cours de spécialisation, vous deviendrez de plus en plus performant dans ce processus itératif.

Inclus

4 vidéos5 lectures1 quiz1 devoir de programmation1 évaluation par les pairs

Bien que le nom de régression logistique puisse suggérer le contraire, nous allons cette semaine passer des tâches de régression aux tâches de classification. La régression logistique est un cas particulier de modèle linéaire généralisé. Comme la régression linéaire, la régression logistique est un outil statistique largement utilisé et l'un des outils fondamentaux de votre boîte à outils de science des données. Il existe de nombreuses applications réelles pour les tâches de classification, notamment dans les domaines financier et biomédical. Dans le laboratoire de cette semaine, vous verrez comment cet algorithme classique vous aidera à prédire si une lame de biopsie provenant du célèbre ensemble de données sur le cancer du sein du Wisconsin présente une masse bénigne ou maligne. Nous vous conseillons également de commencer cette semaine le projet final que vous rendrez à la semaine 7 du cours. Cette semaine, trouvez un ensemble de données pour votre projet, commencez à effectuer l'EDA et définissez votre problème. Utilisez la rubrique du projet comme guide, et n'ayez pas peur d'examiner plusieurs jeux de données jusqu'à ce que vous en trouviez un qui convienne au projet.

Inclus

4 vidéos6 lectures1 quiz1 devoir de programmation1 évaluation par les pairs

Cette semaine, nous allons nous familiariser avec les modèles non paramétriques. Le modèle des plus proches voisins (k-Nearest Neighbors) est intuitivement logique. Les arbres de décision sont un modèle d'apprentissage supervisé qui peut être utilisé pour des tâches de régression ou de classification. Dans le module 2, nous avons découvert le compromis biais-variance, que nous avons gardé à l'esprit tout au long du cours. Les modèles arborescents très flexibles présentent l'avantage de pouvoir capturer des relations complexes et non linéaires. Cependant, ils sont enclins à l'ajustement excessif. Cette semaine et la semaine prochaine, nous explorerons des stratégies telles que l'élagage pour éviter l'overfitting avec les modèles arborescents. Dans le laboratoire de cette semaine, vous créerez un classificateur KNN pour le célèbre ensemble de données MNIST et construirez ensuite un classificateur de spam à l'aide d'un modèle d'arbre de décision. Cette semaine, nous apprécierons une fois de plus la puissance des modèles simples et compréhensibles. Poursuivez votre projet final. Une fois que vous avez finalisé votre ensemble de données et votre AED, commencez à travailler sur l'approche initiale de votre tâche principale d'apprentissage supervisé. Révisez le matériel de cours, lisez des articles de recherche, regardez les dépôts GitHub et les articles Medium pour comprendre votre sujet et planifier votre approche.

Inclus

5 vidéos6 lectures1 quiz1 devoir de programmation1 évaluation par les pairs

La semaine dernière, nous avons découvert les modèles d'arbres. Malgré tous les avantages qu'ils présentent, ces modèles ont quelques faiblesses difficiles à surmonter. Cette semaine, nous allons découvrir les méthodes d'assemblage qui permettent de surmonter la tendance des modèles d'arbre à se surajuster. Le gagnant utilise une approche d'ensemble dans de nombreux concours d'apprentissage automatique, en agrégeant les prédictions de plusieurs modèles d'arbres. Cette semaine, vous commencerez par découvrir les forêts aléatoires et le bagging, une technique qui consiste à entraîner le même algorithme avec différents sous-ensembles de données d'entraînement. Vous découvrirez ensuite le boosting, une méthode d'ensemble dans laquelle les modèles s'entraînent de manière séquentielle. Vous découvrirez deux algorithmes de boosting essentiels : AdaBoost et Gradient Boosting. Cette semaine, travaillez sur l'analyse principale de votre projet final. Répétez et améliorez vos modèles. Comparez différents modèles. Optimisez les hyperparamètres. Parfois, cette partie d'un projet d'apprentissage automatique peut sembler fastidieuse, mais, avec un peu de chance, il sera gratifiant de voir vos performances s'améliorer.

Inclus

4 vidéos5 lectures1 quiz1 devoir de programmation1 évaluation par les pairs

Cette semaine, nous allons explorer un autre sujet avancé, les machines à vecteurs de support. Ne vous laissez pas intimider par ce nom. Cette semaine, nous allons travailler sur la compréhension de ce puissant modèle d'apprentissage supervisé. Nous espérons que vous parviendrez à une compréhension intuitive de concepts essentiels tels que la différence entre les marges dures et douces, l'astuce du noyau et le réglage des hyperparamètres. La semaine prochaine, vous soumettrez les trois livrables de votre projet final : le rapport, la présentation vidéo et un lien vers votre dépôt GitHub. Supposons que vous souhaitiez terminer cette semaine l'itération sur vos modèles, l'optimisation des hyperparamètres, etc. Dans ce cas, la semaine prochaine, vous pourrez peaufiner votre rapport, vous assurer que votre dépôt GitHub est prêt pour l'évaluation par les pairs et faire une excellente présentation de votre travail.

Inclus

4 vidéos4 lectures1 quiz1 devoir de programmation1 évaluation par les pairs

Instructeur

Évaluations de l’enseignant
2.8 (25 évaluations)
Geena Kim
University of Colorado Boulder
3 Cours21 781 apprenants

Offert par

Recommandé si vous êtes intéressé(e) par Apprentissage automatique

Prenez une longueur d'avance pour votre diplôme

Ce cours fait partie des programmes diplômants suivants proposés par University of Colorado Boulder. Si vous êtes accepté(e) et si vous vous inscrivez, votre travail en cours pourra être pris en compte pour l’obtention de votre diplôme et vos progrès pourront être transférés.

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 55

3.3

55 avis

  • 5 stars

    36,36 %

  • 4 stars

    20 %

  • 3 stars

    9,09 %

  • 2 stars

    9,09 %

  • 1 star

    25,45 %

XX
4

Révisé le 4 avr. 2024

SA
5

Révisé le 1 août 2023

MH
5

Révisé le 20 mai 2022

Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions