L'un des domaines les plus utiles de l'apprentissage automatique est la découverte de modèles cachés à partir de données non étiquetées. Ajoutez les bases de cette compétence très demandée à votre boîte à outils de science des données. Dans ce cours, nous apprendrons des méthodes d'apprentissage non supervisé sélectionnées pour la réduction de la dimensionnalité, le clustering et l'apprentissage de caractéristiques latentes. Nous nous concentrerons également sur des applications réelles telles que les systèmes de recommandation avec des exemples pratiques d'algorithmes de recommandation de produits. Une connaissance préalable du codage ou des scripts est nécessaire. Nous utiliserons largement Python tout au long du cours. Des compétences en mathématiques de niveau universitaire, y compris en calcul et en algèbre linéaire, sont nécessaires. Il est recommandé, mais pas obligatoire, de suivre le premier cours de la spécialisation, Introduction à l'apprentissage automatique : Apprentissage supervisé.
Algorithmes non supervisés dans l'apprentissage automatique
Ce cours fait partie de Spécialisation Apprentissage automatique : Théorie et pratique avec Python
Instructeur : Geena Kim
4 108 déjà inscrits
Inclus avec
(20 avis)
Expérience recommandée
Ce que vous apprendrez
Expliquez ce qu'est l'apprentissage non supervisé et énumérez les méthodes utilisées dans ce domaine.
Listez et expliquez les algorithmes des différentes méthodes de factorisation matricielle, ainsi que l'utilisation de chacune d'entre elles.
Listez et expliquez les algorithmes des différentes méthodes de factorisation matricielle, ainsi que l'utilisation de chacune d'entre elles.
Compétences que vous acquerrez
- Catégorie : Analyse de cluster
- Catégorie : Réduction de dimensionnalité
- Catégorie : Apprentissage non supervisé
- Catégorie : Systèmes de recommandation
- Catégorie : Factorisation des matrices
Détails à connaître
Ajouter à votre profil LinkedIn
6 quizzes
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 4 modules dans ce cours
Maintenant que vous disposez d'une base solide en matière d'apprentissage supervisé, nous allons nous intéresser à la découverte de la structure cachée des données non étiquetées. Nous commencerons par une introduction à l'apprentissage non supervisé. Dans ce cours, les modèles n'ont plus d'étiquettes pour apprendre. Ils doivent donner un sens aux données à partir des observations elles-mêmes. Cette semaine, nous nous pencherons sur l'analyse en composantes principales (ACP), une technique fondamentale de réduction des dimensions. Lorsque vous commencez à vous familiariser avec ce sujet, cela peut sembler difficile. Cette section comporte sans aucun doute une part de mathématiques. Cependant, l'ACP peut être appréhendée de manière conceptuelle, peut-être plus facilement que prévu. Dans le cours sur l'apprentissage supervisé, nous avons lutté contre la malédiction de la dimensionnalité. Cette semaine, nous verrons comment l'ACP peut réduire le nombre de dimensions et améliorer les tâches de classification/régression. Vous aurez des lectures, un quiz, et un labo Jupyter Notebook/Peer Review pour implémenter l'algorithme PCA.
Inclus
3 vidéos10 lectures3 quizzes1 évaluation par les pairs2 sujets de discussion1 laboratoire non noté
Cette semaine, nous travaillons sur le clustering, l'une des méthodes d'apprentissage non supervisé les plus populaires. La semaine dernière, nous avons utilisé l'ACP pour trouver une représentation à faible dimension des données. Le clustering, quant à lui, permet de trouver des sous-groupes parmi les observations. Nous pouvons obtenir une intuition significative de la structure des données ou utiliser une procédure telle que Cluster-then-predict. Le regroupement a plusieurs applications, allant de la segmentation de la clientèle et de la publicité, à l'identification de films/musiques similaires, en passant par la recherche génomique et la découverte de sous-types de maladies. Nous nous concentrerons principalement sur le regroupement par K-moyennes et le regroupement hiérarchique, en tenant compte des avantages et des inconvénients des deux méthodes et du choix de mesures telles que la distance ou le lien. Cette semaine, nous avons des lectures, un quiz, et un laboratoire Jupyter Notebook/Peer Review.
Inclus
2 vidéos2 lectures1 quiz1 évaluation par les pairs1 sujet de discussion1 laboratoire non noté
Cette semaine, nous travaillons sur les systèmes de recommandation. Des sites web comme Netflix, Amazon et YouTube proposent des recommandations personnalisées pour des films, des articles ou des vidéos. Cette semaine, nous explorons les stratégies des moteurs de recommandation pour prédire les goûts des utilisateurs. Nous examinerons les approches de filtrage de popularité, de filtrage basé sur le contenu et de filtrage collaboratif, ainsi que les mesures de similarité à utiliser. Lorsque nous travaillons avec des systèmes de recommandation, il y a des défis à relever, comme la complexité temporelle des opérations et la rareté des données. Cette semaine est relativement dense en mathématiques. Vous aurez un quiz dans lequel vous travaillerez avec différents calculs de métriques de similarité. Accordez-vous du temps pour le laboratoire Jupyter de cette semaine et réfléchissez à des implémentations performantes. La section "Peer Review" de cette semaine est courte.
Inclus
4 vidéos1 lecture1 quiz1 devoir de programmation1 évaluation par les pairs
Nous en sommes déjà à la dernière semaine de cours ! Préparez-vous à une nouvelle semaine dense en mathématiques. La semaine dernière, nous avons étudié les systèmes de recommandation. Nous avons utilisé une méthode de filtrage collaboratif par voisinage, en utilisant des mesures de similarité. Les modèles de facteurs latents, y compris la populaire factorisation matricielle (MF), peuvent également être utilisés pour le filtrage collaboratif. Une publication de 1999 dans Nature a rendu la factorisation matricielle non négative extrêmement populaire. La MF a de nombreuses applications, notamment l'analyse d'images, l'exploration de textes/la modélisation de sujets, les systèmes de recommandation, la séparation de signaux audio, la chimie analytique et l'analyse de l'expression des gènes. Cette semaine, nous nous concentrons sur la décomposition en valeurs singulières, la factorisation des matrices non négatives et les méthodes d'approximation. Cette semaine, nous avons des lectures, un quiz et un mini-projet Kaggle utilisant la factorisation matricielle pour catégoriser des articles de presse.
Inclus
5 vidéos1 lecture1 quiz1 évaluation par les pairs
Instructeur
Offert par
Recommandé si vous êtes intéressé(e) par Apprentissage automatique
University of Michigan
Illinois Tech
Alberta Machine Intelligence Institute
Préparer un diplôme
Ce site cours fait partie du (des) programme(s) diplômant(s) suivant(s) proposé(s) par University of Colorado Boulder. Si vous êtes admis et que vous vous inscrivez, les cours que vous avez suivis peuvent compter pour l'apprentissage de votre diplôme et vos progrès peuvent être transférés avec vous.¹
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
Un cours cross-listed est proposé dans le cadre de deux ou plusieurs programmes diplômants de CU Boulder sur Coursera. Par exemple, Dynamic Programming, Greedy Algorithms est proposé en tant que CSCA 5414 pour le MS-CS et DTSA 5503 pour le MS-DS.
- Vous ne pouvez pas obtenir de crédits pour plus d'une version d'un cours figurant sur une liste croisée.
- Vous pouvez identifier les cours à liste croisée en consultant le manuel de l'étudiant de votre programme.
- Votre relevé de notes en sera affecté. Les cours figurant sur des listes croisées sont considérés comme équivalents lors de l'évaluation des conditions d'obtention du diplôme. Toutefois, nous vous encourageons à suivre les versions de votre programme de ces cours (lorsqu'ils sont disponibles) afin de vous assurer que votre relevé de notes reflète le nombre important de cours que vous suivez directement dans votre département d'origine. Tous les cours que vous suivez dans le cadre d'un autre programme apparaîtront sur votre relevé de notes avec le préfixe de ce programme (par exemple, DTSA ou CSCA).
- Les programmes peuvent avoir des exigences différentes en matière de notes minimales pour l'admission et l'obtention du diplôme. Par exemple, le MS-DS exige un C ou mieux dans tous les cours pour l'obtention du diplôme (et une MPC de 3,0 pour l'admission), tandis que le MS-CS exige un B ou mieux dans tous les cours d'approfondissement et un C ou mieux dans tous les cours à option pour l'obtention du diplôme (et un B ou mieux dans chaque cours de la voie d'accès pour l'admission). Tous les programmes exigent que les étudiants maintiennent une moyenne pondérée cumulative de 3,0 pour l'admission et l'obtention du diplôme.
Oui. Les cours figurant sur des listes croisées sont considérés comme équivalents lors de l'évaluation des conditions d'obtention du diplôme. Vous pouvez identifier les cours croisés en consultant le manuel de l'étudiant de votre programme.
Vous pouvez mettre à niveau et payer des frais de scolarité pendant toute période d'inscription ouverte pour obtenir des crédits de CU Boulder de niveau supérieur pour << ce cours / ces cours dans cette spécialisation>>. Étant donné que << ce cours est / ces cours sont >> répertoriés à la fois dans les programmes MS in Computer Science et MS in Data Science, vous devrez déterminer quel programme vous souhaitez obtenir le crédit avant de vous mettre à niveau.
Crédit MS in Data Science (MS-DS) : Pour passer à la version de << ce cours / ces cours >> donnant droit à des crédits en science des données (DTSA), utilisez le formulaire d'inscription au MS-DS. Voir comment cela fonctionne.
MS in Computer Science (MS-CS) Credit : Pour passer à la version à crédits en informatique (CSCA) de << ce cours / ces cours >>, utilisez le formulaire d'inscription MS-CS. Voir comment cela fonctionne.
Si vous n'êtes pas sûr du programme qui vous convient le mieux, consultez les sites web des programmes MS-CS et MS-DS, puis contactez datascience@colorado.edu ou mscscoursera-info@colorado.edu si vous avez encore des questions.