Wesleyan University
Apprentissage automatique pour l'analyse des données
Wesleyan University

Apprentissage automatique pour l'analyse des données

Ce cours fait partie de Spécialisation Analyse et interprétation des données

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

Jen Rose
Lisa Dierker

Instructeurs : Jen Rose

45 288 déjà inscrits

Inclus avec Coursera Plus

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

4.2

(322 avis)

|

95%

10 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Compétences que vous acquerrez

  • Catégorie : Analyse des Données
  • Catégorie : Programmation en Python
  • Catégorie : Apprentissage automatique
  • Catégorie : Analyse exploratoire des données (AED)

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

4.2

(322 avis)

|

95%

10 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Analyse et interprétation des données
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 4 modules dans ce cours

Dans cette session, vous découvrirez les arbres de décision, un type d'algorithme d'exploration de données qui permet de sélectionner, parmi un grand nombre de variables, celles et leurs interactions qui sont les plus importantes pour prédire la variable cible ou la variable réponse à expliquer. Les arbres de décision créent des segmentations ou des sous-groupes dans les données, en appliquant une série de règles ou de critères simples à plusieurs reprises, qui choisissent les constellations de variables qui prédisent le mieux la variable cible.

Inclus

7 vidéos15 lectures1 évaluation par les pairs

Dans cette session, vous découvrirez les forêts aléatoires, un type d'algorithme d'exploration de données qui permet de sélectionner, parmi un grand nombre de variables, celles qui sont les plus importantes pour déterminer la variable cible ou la variable réponse à expliquer. Contrairement aux arbres de décision, les résultats des forêts aléatoires se généralisent bien à de nouvelles données.

Inclus

4 vidéos4 lectures1 évaluation par les pairs

L'analyse de régression lasso est une méthode de réduction et de sélection des variables pour les modèles de régression linéaire. L'objectif de la régression lasso est d'obtenir le sous-ensemble de prédicteurs qui minimise l'erreur de prédiction pour une variable de réponse quantitative. Le lasso y parvient en imposant une contrainte sur les paramètres du modèle qui fait tendre les coefficients de régression de certaines variables vers zéro. Les variables dont le coefficient de régression est égal à zéro après le processus de réduction sont exclues du modèle. Les variables dont les coefficients de régression ne sont pas nuls sont les plus fortement associées à la variable réponse. Les variables explicatives peuvent être quantitatives, catégorielles ou les deux. Dans cette session, vous appliquerez et interpréterez une analyse de régression lasso. Vous acquerrez également de l'expérience dans l'utilisation de la validation croisée k-fold pour sélectionner le modèle le mieux adapté et obtenir une estimation plus précise du taux d'erreur de test de votre modèle. Pour tester un modèle de régression lasso, vous devrez identifier une variable de réponse quantitative dans votre ensemble de données, si ce n'est déjà fait, et choisir quelques variables prédictives (c'est-à-dire explicatives) quantitatives et catégorielles supplémentaires pour développer un plus grand ensemble de prédicteurs. Le fait de disposer d'un plus grand nombre de variables prédictives à tester vous permettra d'optimiser votre expérience de l'analyse de régression lasso. N'oubliez pas que la régression lasso est une méthode d'apprentissage automatique, de sorte que votre choix de prédicteurs supplémentaires ne doit pas nécessairement dépendre d'une hypothèse ou d'une théorie de recherche. Prenez des risques et essayez de nouvelles variables. L'analyse de régression lasso vous aidera à déterminer lesquels de vos prédicteurs sont les plus importants. Notez également que si vous travaillez avec un ensemble de données relativement petit, vous n'avez pas besoin de diviser vos données en ensembles de données d'entraînement et de données de test. La méthode de validation croisée que vous appliquez est conçue pour éliminer la nécessité de diviser vos données lorsque vous disposez d'un nombre limité d'observations.

Inclus

5 vidéos3 lectures1 évaluation par les pairs

L'analyse de grappes est une méthode d'apprentissage automatique non supervisée qui répartit les observations d'un ensemble de données en un plus petit ensemble de grappes où chaque observation n'appartient qu'à une seule grappe. L'objectif de l'analyse de grappes est de regrouper les observations en sous-ensembles sur la base de la similarité de leurs réponses à plusieurs variables. Les variables de regroupement doivent être principalement des variables quantitatives, mais des variables binaires peuvent également être incluses. Dans cette session, nous vous montrerons comment utiliser l'analyse de grappes k-means pour identifier les grappes d'observations dans votre ensemble de données. Vous acquerrez de l'expérience dans l'interprétation des résultats de l'analyse en grappes en utilisant des méthodes graphiques pour vous aider à déterminer le nombre de grappes à interpréter, et en examinant les moyennes des variables de grappes pour évaluer les profils des grappes. Enfin, vous aurez l'occasion de valider votre solution de cluster en examinant les différences entre les clusters sur une variable non incluse dans votre analyse de cluster. Vous pouvez utiliser les mêmes variables que celles que vous avez utilisées au cours des semaines précédentes comme variables de regroupement. Si la plupart ou la totalité de vos variables explicatives précédentes sont catégoriques, vous devez identifier quelques variables quantitatives supplémentaires de regroupement à partir de votre ensemble de données. Idéalement, la plupart de vos variables de regroupement seront quantitatives, bien que vous puissiez également inclure quelques variables binaires. En outre, vous devrez identifier une variable de réponse quantitative ou binaire de votre ensemble de données que vous n'inclurez pas dans votre analyse en grappes. Vous utiliserez cette variable pour valider vos grappes en évaluant si vos grappes diffèrent de manière significative sur cette variable de réponse à l'aide de méthodes statistiques, telles que l'analyse de la variance ou l'analyse du chi-carré, que vous avez apprises dans le cours 2 de la spécialisation (Outils d'analyse des données). Notez également que si vous travaillez avec un ensemble de données relativement petit, vous n'avez pas besoin de diviser vos données en ensembles de données d'entraînement et de données de test.

Inclus

6 vidéos3 lectures1 évaluation par les pairs

Instructeurs

Évaluations de l’enseignant
4.3 (17 évaluations)
Jen Rose
Wesleyan University
4 Cours92 020 apprenants

Offert par

Wesleyan University

Recommandé si vous êtes intéressé(e) par Apprentissage automatique

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 322

4.2

322 avis

  • 5 stars

    56,83 %

  • 4 stars

    25,46 %

  • 3 stars

    7,76 %

  • 2 stars

    4,03 %

  • 1 star

    5,90 %

MS
4

Révisé le 21 mars 2016

MK
4

Révisé le 26 avr. 2020

AP
4

Révisé le 5 janv. 2018

Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions