Ce cours couvre les techniques de base utilisées dans l'exploration de données, y compris l'analyse des motifs fréquents, la classification, le regroupement, l'analyse des valeurs aberrantes, ainsi que l'exploration de données complexes et les frontières de la recherche dans le domaine de l'exploration de données.
Méthodes d'exploration de données
Ce cours fait partie de Spécialisation Fondements et pratiques du Data Mining
Instructeur : Qin (Christine) Lv
6 239 déjà inscrits
Inclus dans le site
(28 avis)
Expérience recommandée
Ce que vous apprendrez
Identifier les principales fonctionnalités de la modélisation des données dans le pipeline d'exploration des données
Appliquer les techniques qui peuvent être utilisées pour réaliser les fonctionnalités de base de la modélisation des données et expliquer comment elles fonctionnent.
Évaluer les techniques de modélisation des données, déterminer celle qui convient le mieux à une tâche particulière et identifier les améliorations potentielles.
Compétences que vous acquerrez
- Catégorie : analyse des valeurs aberrantes
- Catégorie : classification
- Catégorie : évaluation du modèle
- Catégorie : l'analyse des schémas fréquents
- Catégorie : regroupement
Détails à connaître
Ajouter à votre profil LinkedIn
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 4 modules dans ce cours
Cette semaine commence par une présentation de ce cours, Méthodes d'exploration de données, puis se concentre sur l'analyse des motifs fréquents, y compris l'algorithme Apriori et l'algorithme FP-growth pour l'exploration des items fréquents, ainsi que sur les règles d'association et l'analyse des corrélations.
Inclus
15 vidéos3 lectures1 devoir de programmation1 sujet de discussion
Cette semaine présente l'apprentissage supervisé, la classification, la prédiction et couvre plusieurs méthodes de classification de base, notamment l'induction par arbre de décision, la classification bayésienne, les machines à vecteurs de support, les réseaux neuronaux et les méthodes d'ensemble. Elle aborde également l'évaluation et la comparaison des modèles de classification.
Inclus
9 vidéos1 devoir de programmation
Cette semaine vous présente l'apprentissage non supervisé, le clustering, et couvre plusieurs méthodes de clustering de base, notamment le partitionnement, le clustering hiérarchique, le clustering basé sur une grille, le clustering basé sur la densité et le clustering probabiliste. Des sujets avancés pour le clustering en haute dimension, le bi-clustering, le clustering de graphe et le clustering basé sur les contraintes sont également abordés.
Inclus
8 vidéos1 lecture1 devoir de programmation
Cette semaine aborde trois types de valeurs aberrantes (globales, contextuelles et collectives) et la manière dont différentes méthodes peuvent être utilisées pour identifier et analyser ces valeurs aberrantes. Elle aborde également certaines méthodes avancées d'exploration de données complexes, ainsi que les frontières de la recherche dans le domaine de l'exploration de données.
Inclus
8 vidéos1 évaluation par les pairs
Instructeur
Offert par
Recommandé si vous êtes intéressé(e) par Analyse des Données
University of Colorado Boulder
University of Colorado Boulder
University of Colorado Boulder
Universidad Nacional Autónoma de México
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par University of Colorado Boulder. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Un cours cross-listed est proposé dans le cadre de deux ou plusieurs programmes diplômants de CU Boulder sur Coursera. Par exemple, Dynamic Programming, Greedy Algorithms est proposé en tant que CSCA 5414 pour le MS-CS et DTSA 5503 pour le MS-DS.
- Vous ne pouvez pas obtenir de crédits pour plus d'une version d'un cours figurant sur une liste croisée.
- Vous pouvez identifier les cours à liste croisée en consultant le manuel de l'étudiant de votre programme.
- Votre relevé de notes en sera affecté. Les cours figurant sur des listes croisées sont considérés comme équivalents lors de l'évaluation des conditions d'obtention du diplôme. Toutefois, nous vous encourageons à suivre les versions de votre programme de ces cours (lorsqu'ils sont disponibles) afin de vous assurer que votre relevé de notes reflète le nombre important de cours que vous suivez directement dans votre département d'origine. Tous les cours que vous suivez dans le cadre d'un autre programme apparaîtront sur votre relevé de notes avec le préfixe de ce programme (par exemple, DTSA ou CSCA).
- Les programmes peuvent avoir des exigences différentes en matière de notes minimales pour l'admission et l'obtention du diplôme. Par exemple, le MS-DS exige un C ou mieux dans tous les cours pour l'obtention du diplôme (et une MPC de 3,0 pour l'admission), tandis que le MS-CS exige un B ou mieux dans tous les cours d'approfondissement et un C ou mieux dans tous les cours à option pour l'obtention du diplôme (et un B ou mieux dans chaque cours de la voie d'accès pour l'admission). Tous les programmes exigent que les étudiants maintiennent une moyenne pondérée cumulative de 3,0 pour l'admission et l'obtention du diplôme.
Oui. Les cours figurant sur des listes croisées sont considérés comme équivalents lors de l'évaluation des conditions d'obtention du diplôme. Vous pouvez identifier les cours croisés en consultant le manuel de l'étudiant de votre programme.
Vous pouvez mettre à niveau et payer des frais de scolarité pendant toute période d'inscription ouverte pour obtenir des crédits de CU Boulder de niveau supérieur pour << ce cours / ces cours dans cette spécialisation>>. Étant donné que << ce cours est / ces cours sont >> répertoriés à la fois dans les programmes MS in Computer Science et MS in Data Science, vous devrez déterminer quel programme vous souhaitez obtenir le crédit avant de vous mettre à niveau.
Crédit MS in Data Science (MS-DS) : Pour passer à la version de << ce cours / ces cours >> donnant droit à des crédits en science des données (DTSA), utilisez le formulaire d'inscription au MS-DS. Voir comment cela fonctionne.
MS in Computer Science (MS-CS) Credit : Pour passer à la version à crédits en informatique (CSCA) de << ce cours / ces cours >>, utilisez le formulaire d'inscription MS-CS. Voir comment cela fonctionne.
Si vous n'êtes pas sûr du programme qui vous convient le mieux, consultez les sites web des programmes MS-CS et MS-DS, puis contactez datascience@colorado.edu ou mscscoursera-info@colorado.edu si vous avez encore des questions.