Einer der nützlichsten Bereiche des maschinellen Lernens ist die Entdeckung verborgener Muster aus nicht beschrifteten Daten. Erweitern Sie Ihr Data Science-Toolkit um die Grundlagen dieser gefragten Fähigkeit. In diesem Kurs lernen wir ausgewählte Methoden des unüberwachten Lernens zur Dimensionalitätsreduktion, zum Clustering und zum Lernen latenter Merkmale kennen. Wir werden uns auch auf reale Anwendungen wie Empfehlungssysteme mit praktischen Beispielen von Produktempfehlungsalgorithmen konzentrieren. Vorkenntnisse in Programmierung oder Skripting sind erforderlich. Wir werden während des Kurses ausgiebig mit Python arbeiten. Mathekenntnisse auf College-Niveau, einschließlich Kalkül und Lineare Algebra, sind erforderlich. Es ist empfehlenswert, aber nicht erforderlich, den ersten Kurs der Specializations, Introduction to Machine Learning, zu besuchen: Überwachtes Lernen.
Unüberwachte Algorithmen im maschinellen Lernen
Dieser Kurs ist Teil von Spezialisierung Maschinelles Lernen: Theorie und praktische Anwendung mit Python
Dozent: Geena Kim
4.108 bereits angemeldet
Bei enthalten
(20 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Erklären Sie, was unüberwachtes Lernen ist, und nennen Sie die Methoden, die beim unüberwachten Lernen verwendet werden.
Listen Sie die Algorithmen für die verschiedenen Methoden der Matrixfaktorisierung auf und erklären Sie, wofür sie jeweils verwendet werden.
Listen Sie die Algorithmen für die verschiedenen Methoden der Matrixfaktorisierung auf und erklären Sie, wofür sie jeweils verwendet werden.
Kompetenzen, die Sie erwerben
- Kategorie: Cluster-Analyse
- Kategorie: Dimensionalitätsreduktion
- Kategorie: Unüberwachtes Lernen
- Kategorie: Empfehlungssysteme
- Kategorie: Matrix-Faktorisierung
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
6 Quizzes
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 4 Module
Jetzt, da Sie eine solide Grundlage in überwachtem Lernen haben, wenden wir uns der Aufdeckung der verborgenen Struktur von nicht beschrifteten Daten zu. Wir beginnen mit einer Einführung in das unüberwachte Lernen. In diesem Kurs haben die Modelle keine Bezeichnungen mehr, von denen sie lernen können. Sie müssen den Sinn der Daten aus den Beobachtungen selbst erschließen. Diese Woche beschäftigen wir uns mit der Hauptkomponentenanalyse (PCA), einer grundlegenden Technik zur Dimensionsreduktion. Wenn Sie sich zum ersten Mal mit diesem Thema befassen, mag es nicht einfach erscheinen. Zweifelsohne ist in diesem Abschnitt etwas Mathematik im Spiel. Die PCA lässt sich jedoch konzeptionell begreifen, vielleicht leichter als erwartet. Im Kurs Überwachtes Lernen haben wir mit dem Fluch der Dimensionalität gekämpft. Diese Woche werden wir sehen, wie PCA die Anzahl der Dimensionen reduzieren und Klassifizierungs-/Regressionsaufgaben verbessern kann. Sie werden eine Lektüre, ein Quiz und ein Jupyter-Notebook-Labor/Peer Review haben, um den PCA-Algorithmus zu implementieren.
Das ist alles enthalten
3 Videos10 Lektüren3 Quizzes1 peer review2 Diskussionsthemen1 Unbewertetes Labor
Diese Woche arbeiten wir mit Clustering, einer der beliebtesten Methoden des unüberwachten Lernens. Letzte Woche haben wir PCA verwendet, um eine niedrigdimensionale Darstellung der Daten zu finden. Clustering hingegen findet Untergruppen unter den Beobachtungen. Wir können eine aussagekräftige Intuition der Datenstruktur erhalten oder ein Verfahren wie Cluster-then-predict verwenden. Clustering hat mehrere Anwendungen, die von der Kundensegmentierung im Marketing und in der Werbung über die Identifizierung ähnlicher Filme/Musik bis hin zur Genomforschung und der Entdeckung von Krankheitssubtypen reichen. Wir werden uns vor allem auf das K-Means-Clustering und das hierarchische Clustering konzentrieren und dabei die Vor- und Nachteile beider Verfahren sowie die Wahl von Metriken wie Distanz oder Verknüpfung berücksichtigen. In dieser Woche gibt es Lektüre, ein Quiz und ein Jupyter-Notebook-Labor/Peer Review.
Das ist alles enthalten
2 Videos2 Lektüren1 Quiz1 peer review1 Diskussionsthema1 Unbewertetes Labor
Diese Woche arbeiten wir mit Recommender Systems. Websites wie Netflix, Amazon und YouTube zeigen personalisierte Empfehlungen für Filme, Artikel oder Videos an. In dieser Woche untersuchen wir die Strategien von Empfehlungsmaschinen, um die Vorlieben der Benutzer vorherzusagen. Wir werden uns mit Popularität, inhaltsbasierten und kollaborativen Filteransätzen befassen und welche Ähnlichkeitsmetriken zu verwenden sind. Bei der Arbeit mit Empfehlungssystemen gibt es immer wieder Herausforderungen wie die zeitliche Komplexität von Operationen und spärliche Daten. Diese Woche ist relativ rechenintensiv. Sie werden ein Quiz haben, in dem Sie mit verschiedenen Berechnungen von Ähnlichkeitsmetriken arbeiten werden. Nehmen Sie sich Zeit für das Jupyter-Notebook-Labor in dieser Woche und überlegen Sie sich leistungsfähige Implementierungen. Der Abschnitt Peer Review ist diese Woche kurz.
Das ist alles enthalten
4 Videos1 Lektüre1 Quiz1 Programmieraufgabe1 peer review
Wir sind bereits bei der letzten Woche des Kursmaterials angelangt! Machen Sie sich bereit für eine weitere dichte Mathe-Woche. Letzte Woche haben wir etwas über Empfehlungssysteme gelernt. Wir haben die Neighborhood-Methode der kollaborativen Filterung unter Verwendung von Ähnlichkeitsmaßen verwendet. Latent Factor Models, einschließlich der beliebten Matrix Factorization (MF), können ebenfalls für Collaborative Filtering verwendet werden. Eine Veröffentlichung in Nature aus dem Jahr 1999 machte die nicht-negative Matrix-Faktorisierung extrem populär. MF hat viele Anwendungen, darunter Bildanalyse, Textmining/Themenmodellierung, Empfehlungssysteme, Audiosignaltrennung, analytische Chemie und Genexpressionsanalyse. In dieser Woche konzentrieren wir uns auf Singular Value Decomposition, Non-negative Matrix Factorization und Approximationsmethoden. In dieser Woche haben wir Lektüre, ein Quiz und ein Kaggle-Miniprojekt, bei dem die Matrixfaktorisierung zur Kategorisierung von Nachrichtenartikeln eingesetzt wird.
Das ist alles enthalten
5 Videos1 Lektüre1 Quiz1 peer review
Dozent
Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren
Auf einen Abschluss hinarbeiten
Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von University of Colorado Boulderangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Ein Cross-Listed-Kurs wird unter zwei oder mehr CU Boulder-Studiengängen auf Coursera angeboten. Zum Beispiel wird Dynamic Programming, Greedy Algorithms sowohl als CSCA 5414 für den MS-CS als auch als DTSA 5503 für den MS-DS angeboten.
- Sie können nicht für mehr als eine Version eines überkreuzten Kurses Punkte sammeln.
- Sie können im Studentenhandbuch Ihres Studiengangs nachsehen, ob es sich um einen Cross-Listed-Kurs handelt.
- Ihr Zeugnis wird davon betroffen sein. Überschneidende Kurse werden bei der Bewertung der Abschlussanforderungen als gleichwertig betrachtet. Wir empfehlen Ihnen jedoch, die von Ihrem Studiengang angebotenen Kurse zu belegen (sofern verfügbar), um sicherzustellen, dass Ihr CU-Zeugnis den erheblichen Umfang der Kursarbeit widerspiegelt, die Sie direkt in Ihrem Heimatfachbereich absolvieren. Alle Kurse, die Sie in einem anderen Studiengang absolvieren, werden auf Ihrem CU-Zeugnis mit dem Kurspräfix des betreffenden Studiengangs aufgeführt (z.B. DTSA vs. CSCA).
- Die Programme können unterschiedliche Mindestanforderungen für die Zulassung und den Abschluss haben. Der MS-DS erfordert zum Beispiel ein C oder besser in allen Kursen für den Abschluss (und ein 3,0 Pathway GPA für die Zulassung), während der MS-CS ein B oder besser in allen Breitenkursen und ein C oder besser in allen Wahlkursen für den Abschluss erfordert (und ein B oder besser in jedem Pathway-Kurs für die Zulassung). Alle Programme verlangen, dass die Studenten für die Zulassung und den Abschluss einen kumulativen GPA von 3,0 erreichen.
Ja. Überkreuzte Kurse werden bei der Bewertung der Abschlussanforderungen als gleichwertig betrachtet. Sie können im Studentenhandbuch Ihres Studiengangs nachsehen, welche Kurse auf der Liste stehen.
Sie können während jeder offenen Einschreibungsperiode ein Upgrade durchführen und die Studiengebühren bezahlen, um eine Anrechnung für << diesen Kurs / diese Kurse in dieser Specialization>> auf Graduate-Ebene der CU Boulder zu erhalten. Da << dieser Kurs / diese Kurse >> sowohl im MS in Computer Science als auch im MS in Data Science Programm aufgelistet sind, müssen Sie vor dem Upgrade festlegen, für welches Programm Sie die Credits erwerben möchten.
MS in Data Science (MS-DS) Credit: Um ein Upgrade auf die anrechenbare Data Science (DTSA)-Version von << diesem Kurs / diesen Kursen >> durchzuführen, verwenden Sie das MS-DS-Anmeldeformular. Siehe Wie es funktioniert.
MS in Computer Science (MS-CS) Credit : Um auf die anrechenbare Computer Science (CSCA) Version von << diesem Kurs / diesen Kursen >> umzusteigen, verwenden Sie das MS-CS Anmeldeformular. Siehe Wie es funktioniert.
Wenn Sie sich nicht sicher sind, welches Programm für Sie am besten geeignet ist, sehen Sie sich die Websites der MS-CS und MS-DS Programme an und kontaktieren Sie datascience@colorado.edu oder mscscoursera-info@colorado.edu, wenn Sie noch Fragen haben.