Northeastern University
Ingénieur de données mining : Techniques et utilisations
Northeastern University

Ingénieur de données mining : Techniques et utilisations

Kirankumar Trivedi

Instructeur : Kirankumar Trivedi

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire
Certaines connaissances prérequises
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
niveau Intermédiaire
Certaines connaissances prérequises
1 semaine à compléter
à 10 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Compétences que vous acquerrez

  • Catégorie : Réduction de dimensionnalité
  • Catégorie : Logiciel de Visualisation de Données
  • Catégorie : Algorithmes de classification
  • Catégorie : Data mining
  • Catégorie : Prise de décision fondée sur les données
  • Catégorie : Analyse exploratoire des données (AED)
  • Catégorie : Big Data
  • Catégorie : Prévisions
  • Catégorie : Analyse des Données
  • Catégorie : Apprentissage automatique appliqué
  • Catégorie : Analyse prédictive
  • Catégorie : Prétraitement de données
  • Catégorie : Apprentissage non supervisé
  • Catégorie : Analyse de régression
  • Catégorie : Analyse statistique
  • Catégorie : Nettoyage des données
  • Catégorie : Transformation de données
  • Catégorie : Évaluation de modèles

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

5 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

 logos de Petrobras, TATA, Danone, Capgemini, P&G et L'Oreal

Il y a 4 modules dans ce cours

Dans ce module, les participants exploreront les concepts essentiels des données dans tous les domaines, en comprenant les divers types, attributs et caractéristiques des données. Ils saisiront les principes fondamentaux, les méthodologies et la portée du Data mining, ce qui leur permettra d'analyser efficacement les données et d'en extraire des informations précieuses. Grâce à cette approche globale, les apprenants seront en mesure d'utiliser les concepts de données clés, ce qui facilitera la prise de décision éclairée et l'innovation dans divers domaines.

Inclus

5 vidéos8 lectures2 devoirs2 sujets de discussion

Ce module vise à transmettre une compréhension globale des concepts de données, couvrant divers domaines. Les participants apprendront à différencier les types de données, les attributs et les caractéristiques. Ils exploreront les principes fondamentaux et les méthodologies du Data mining, ce qui leur permettra d'extraire des informations significatives des ensembles de données. En maîtrisant ces objectifs, les apprenants seront dotés des connaissances et des compétences nécessaires pour analyser efficacement les données et prendre des décisions éclairées dans divers contextes professionnels.

Inclus

3 vidéos13 lectures1 devoir1 sujet de discussion

Tout au long de ce module, nous nous intéresserons à la réduction de la dimensionnalité, une technique permettant de simplifier les ensembles de données complexes afin de faciliter l'analyse et la visualisation. En mettant en œuvre des méthodes de réduction de la dimensionnalité telles que l'Analyse en composantes principales (ACP) et le t-Distributed Stochastic Neighbor Embedding (t-SNE), nous comprendrons comment réduire efficacement le nombre de caractéristiques tout en préservant les informations essentielles. Nous apprendrons à sélectionner et à appliquer les techniques de réduction de la dimensionnalité les plus appropriées en fonction des types de données et des objectifs analytiques, améliorant ainsi la performance et l'interprétabilité des modèles. Ce module partage les outils permettant de naviguer et d'extraire des informations significatives à partir d'ensembles de données à haute dimension, ouvrant ainsi la voie à une analyse des données et à une prise de décision plus efficaces.

Inclus

4 vidéos9 lectures1 devoir1 sujet de discussion

Dans ce module, nous apprenons le concept du compromis biais-variance dans l'apprentissage automatique. Pour obtenir des modèles qui généralisent bien, il faut trouver un équilibre délicat entre le biais et la variance afin d'éviter le sous-ajustement et le surajustement. Le biais représente l'erreur due à une simplification excessive d'un problème complexe, tandis que la variance quantifie la sensibilité du modèle à différents sous-ensembles de données d'entraînement. Nous explorons les stratégies de lutte contre le biais et la variance dans le développement de modèles qui trouvent le juste équilibre entre précision et généralisation. En passant aux mesures de régression, nous examinons les outils pratiques utilisés pour mesurer et évaluer les performances des modèles dans les tâches de régression, en nous concentrant sur des mesures telles que l'erreur quadratique moyenne (RMSE). Enfin, nous parcourons le paysage de l'évaluation des performances des modèles dans les tâches de classification binaire, en explorant des mesures avancées telles que le F1-score, le MCC (Matthews Coefficient de corrélation), les scores de propension et la courbe AUC-ROC.

Inclus

5 vidéos10 lectures1 devoir1 sujet de discussion

Instructeur

Kirankumar Trivedi
Northeastern University
1 Cours162 apprenants

Offert par

En savoir plus sur Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Coursera Plus

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions