University of Washington
Maschinelles Lernen: Klassifizierung
University of Washington

Maschinelles Lernen: Klassifizierung

Dieser Kurs ist Teil von Spezialisierung Maschinelles Lernen

Emily Fox
Carlos Guestrin

Dozenten: Emily Fox

126.906 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.7

(3,732 Bewertungen)

Es dauert 21 Stunden
3 Wochen bei 7 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
94%
Den meisten Lernenden hat dieser Kurs gefallen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.7

(3,732 Bewertungen)

Es dauert 21 Stunden
3 Wochen bei 7 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
94%
Den meisten Lernenden hat dieser Kurs gefallen

Kompetenzen, die Sie erwerben

  • Kategorie: Logistische Regression
  • Kategorie: Statistische Klassifizierung
  • Kategorie: Klassifizierungsalgorithmen
  • Kategorie: Entscheidungsbaum

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

19 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Maschinelles Lernen
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 10 Module

Die Klassifizierung ist eine der am weitesten verbreiteten Techniken im Bereich des maschinellen Lernens mit einer breiten Palette von Anwendungen, darunter Sentimentanalyse, Werbezielgruppenansprache, Spam-Erkennung, Risikobewertung, medizinische Diagnose und Bildklassifizierung. Das Hauptziel der Klassifizierung ist die Vorhersage einer Kategorie oder Klasse y aus einigen Eingaben x. In diesem Kurs werden Sie mit den grundlegenden Modellen und Algorithmen vertraut gemacht, die bei der Klassifizierung verwendet werden, sowie mit einer Reihe von Kernkonzepten des maschinellen Lernens. Sie werden nicht alle Aspekte der Klassifizierung abdecken, sondern sich auf einige wenige Kerntechniken konzentrieren, die in der Praxis häufig eingesetzt werden, um Spitzenleistungen zu erzielen. Indem Sie unserem praktischen Ansatz folgen, werden Sie Ihre eigenen Algorithmen in mehreren realen Aufgabenstellungen implementieren und die Kerntechniken, die Sie benötigen, um mit diesen Ansätzen in der Praxis erfolgreich zu sein, gründlich verstehen. Diese Einführung in den Kurs gibt Ihnen einen Überblick über die Themen, die wir behandeln werden, sowie über das Hintergrundwissen und die Ressourcen, die wir bei Ihnen voraussetzen.

Das ist alles enthalten

8 Videos4 Lektüren

Lineare Klassifikatoren gehören zu den praktischsten Klassifizierungsmethoden. In unserer Fallstudie zur Stimmungsanalyse assoziiert ein linearer Klassifikator zum Beispiel einen Koeffizienten mit der Anzahl der einzelnen Wörter im Satz. In diesem Modul werden Sie mit dieser Art der Darstellung vertraut gemacht. Sie werden sich auf einen besonders nützlichen Typ von linearem Klassifikator, die logistische Regression, konzentrieren, die Ihnen nicht nur die Vorhersage einer Klasse ermöglicht, sondern auch eine mit der Vorhersage verbundene Wahrscheinlichkeit liefert. Diese Wahrscheinlichkeiten sind äußerst nützlich, da sie ein gewisses Maß an Vertrauen in die Vorhersagen vermitteln. In diesem Modul werden Sie auch in der Lage sein, Merkmale aus kategorialen Eingaben zu konstruieren und Klassifizierungsprobleme mit mehr als zwei Klassen (Multiklassenprobleme) zu bewältigen. Sie werden die Ergebnisse dieser Techniken anhand einer realen Aufgabe zur Stimmungsanalyse von Produkten untersuchen.

Das ist alles enthalten

18 Videos2 Lektüren2 Aufgaben

Nachdem Sie sich mit linearen Klassifikatoren und logistischer Regression vertraut gemacht haben, können Sie jetzt eintauchen und Ihren ersten Lernalgorithmus für die Klassifizierung schreiben. Insbesondere werden Sie Gradient Ascent verwenden, um die Koeffizienten Ihres Klassifikators aus den Daten zu lernen. Zunächst müssen Sie die Qualitätsmetrik für diese Aufgaben mithilfe eines Ansatzes namens Maximum Likelihood Estimation (MLE) definieren. Sie werden auch mit einer einfachen Technik zur Auswahl der Schrittgröße für den Gradientenanstieg vertraut gemacht. Ein optionaler, fortgeschrittener Teil dieses Moduls behandelt die Ableitung des Gradienten für die logistische Regression. Sie werden Ihren eigenen Lernalgorithmus für die logistische Regression von Grund auf implementieren und ihn verwenden, um einen Klassifikator für die Stimmungsanalyse zu lernen.

Das ist alles enthalten

18 Videos2 Lektüren2 Aufgaben

Wie wir im Regressionskurs gesehen haben, ist die Überanpassung vielleicht die größte Herausforderung, mit der Sie konfrontiert werden, wenn Sie Ansätze des maschinellen Lernens in der Praxis anwenden. Diese Herausforderung kann bei der logistischen Regression besonders groß sein, wie Sie in diesem Modul feststellen werden, da wir nicht nur riskieren, eine zu komplexe Entscheidungsgrenze zu erhalten, sondern Ihr Klassifikator auch zu viel Vertrauen in die von ihm vorhergesagten Wahrscheinlichkeiten gewinnen kann. In diesem Modul werden Sie sich eingehend mit der Überanpassung bei der Klassifizierung befassen und anhand einiger interessanter Visualisierungen der Ergebnisse der Klassifizierer umfassende praktische Erkenntnisse gewinnen. Anschließend werden Sie einen Regularisierungsterm zu Ihrer Optimierung hinzufügen, um das Overfitting zu verringern. Sie werden sowohl die L2-Regularisierung untersuchen, um große Koeffizientenwerte zu bestrafen, als auch die L1-Regularisierung, um zusätzliche Sparsamkeit in den Koeffizienten zu erreichen. Schließlich werden Sie Ihren Gradientenanstiegsalgorithmus modifizieren, um regularisierte logistische Regressionsklassifikatoren zu lernen. Sie werden Ihren eigenen regularisierten logistischen Regressionsklassifikator von Grund auf implementieren und die Auswirkungen der L2-Strafe auf reale Stimmungsanalysedaten untersuchen.

Das ist alles enthalten

13 Videos2 Lektüren2 Aufgaben

Zusammen mit linearen Klassifizierern gehören Entscheidungsbäume zu den am häufigsten verwendeten Klassifizierungstechniken in der realen Welt. Diese Methode ist äußerst intuitiv, einfach zu implementieren und liefert interpretierbare Vorhersagen. In diesem Modul machen Sie sich mit der zentralen Darstellung von Entscheidungsbäumen vertraut. Anschließend werden Sie einen einfachen, rekursiven Greedy-Algorithmus entwerfen, um Entscheidungsbäume aus Daten zu lernen. Schließlich werden Sie diesen Ansatz erweitern, um mit kontinuierlichen Eingaben umgehen zu können, eine grundlegende Voraussetzung für praktische Probleme. In diesem Modul werden Sie eine brandneue Fallstudie aus dem Finanzsektor untersuchen: die Vorhersage des mit einem Bankkredit verbundenen Risikos. Sie werden Ihren eigenen Entscheidungsbaum-Lernalgorithmus auf realen Kreditdaten implementieren.

Das ist alles enthalten

13 Videos3 Lektüren3 Aufgaben

Von allen Techniken des maschinellen Lernens sind Entscheidungsbäume mit am anfälligsten für Overfitting. Keine praktische Implementierung ist möglich, ohne Ansätze einzubeziehen, die diese Herausforderung abmildern. In diesem Modul werden Sie anhand verschiedener Visualisierungen und Untersuchungen untersuchen, warum Entscheidungsbäume unter erheblichen Overfitting-Problemen leiden. Unter Anwendung des Prinzips von Occams Rasiermesser werden Sie die Überanpassung durch das Lernen einfacherer Bäume abmildern. Zunächst werden Sie Algorithmen entwerfen, die den Lernprozess stoppen, bevor die Entscheidungsbäume übermäßig komplex werden. In einem optionalen Abschnitt werden Sie einen sehr praktischen Ansatz entwerfen, der einen übermäßig komplexen Baum lernt und ihn dann durch Beschneidung vereinfacht. Ihre Implementierung wird die Auswirkungen dieser Techniken auf die Abschwächung von Overfitting an unserem realen Darlehensdatensatz untersuchen.

Das ist alles enthalten

8 Videos2 Lektüren2 Aufgaben

Bei Problemen des maschinellen Lernens in der realen Welt gibt es viele fehlende Daten. Das heißt, sehr oft werden einige der Eingaben nicht für alle Datenpunkte beobachtet. Dies ist eine sehr große Herausforderung, die in den meisten Fällen auftritt und sorgfältig behandelt werden muss, um eine gute Leistung zu erzielen. Dieses Thema wird in Kursen zum maschinellen Lernen nur selten behandelt. In diesem Modul werden Sie das Problem der fehlenden Daten direkt angehen. Sie beginnen mit den beiden grundlegendsten Techniken zur Umwandlung eines Datensatzes mit fehlenden Daten in einen sauberen Datensatz, nämlich dem Überspringen fehlender Werte und der Eingabe fehlender Werte. In einem fortgeschrittenen Abschnitt werden Sie außerdem eine Modifikation des Entscheidungsbaum-Lernalgorithmus entwerfen, die Entscheidungen über fehlende Daten direkt in das Modell einbaut. Sie werden diese Techniken auch in Ihrer Implementierung mit echten Daten erproben.

Das ist alles enthalten

6 Videos1 Lektüre1 Aufgabe

Eine der spannendsten theoretischen Fragen im Bereich des maschinellen Lernens ist, ob einfache Klassifikatoren zu einem hochpräzisen Ensemble kombiniert werden können. Diese Frage führte zur Entwicklung von Boosting, einer der wichtigsten und praktischsten Techniken des maschinellen Lernens heute. Dieser einfache Ansatz kann die Genauigkeit eines beliebigen Klassifizierers erhöhen und wird in der Praxis häufig verwendet, z.B. von mehr als der Hälfte der Teams, die die Kaggle-Wettbewerbe für maschinelles Lernen gewinnen. In diesem Modul werden Sie zunächst den Ensemble-Klassifikator definieren, bei dem mehrere Modelle über die beste Vorhersage abstimmen. Anschließend werden Sie einen Boosting-Algorithmus namens AdaBoost kennenlernen, der einen hervorragenden Ansatz für das Boosten von Klassifikatoren bietet. Anhand von Visualisierungen werden Sie viele der praktischen Aspekte dieser Technik kennenlernen. Sie werden Ihre eigene Implementierung von AdaBoost von Grund auf neu erstellen und damit die Leistung Ihres Kreditrisikoprädiktors auf realen Daten steigern.

Das ist alles enthalten

13 Videos3 Lektüren3 Aufgaben

In vielen realen Situationen sind Genauigkeit oder Fehler nicht die besten Qualitätsmaßstäbe für die Klassifizierung. Sie werden eine Fallstudie untersuchen, die dieses Problem deutlich macht: die Verwendung der Stimmungsanalyse zur Anzeige positiver Bewertungen auf einer Restaurant-Website. Anstelle von Genauigkeit werden Sie zwei Metriken definieren: Präzision und Recall, die in der Praxis häufig verwendet werden, um die Qualität von Klassifizierern zu messen. Sie werden untersuchen, wie die von Ihrem Klassifikator ausgegebenen Wahrscheinlichkeiten verwendet werden können, um Präzision und Recall gegeneinander abzuwägen, und Sie werden dieses Spektrum anhand von Präzisions-Recall-Kurven untersuchen. In Ihrer praktischen Implementierung werden Sie diese Metriken mit Ihrem gelernten Klassifikator auf realen Sentimentanalyse-Daten berechnen.

Das ist alles enthalten

8 Videos2 Lektüren2 Aufgaben

Mit dem Aufkommen des Internets, dem Wachstum der sozialen Medien und der Einbettung von Sensoren in der Welt sind die Datenmengen, die unsere Algorithmen für maschinelles Lernen verarbeiten müssen, im letzten Jahrzehnt enorm gewachsen. Dieser Effekt wird manchmal als "Big Data" bezeichnet. Daher müssen unsere Lernalgorithmen auf immer größere Datensätze skalieren. In diesem Modul werden Sie eine kleine Abwandlung des Gradientenaufstiegs, den stochastischen Gradienten, entwickeln, der die Laufzeit unserer Algorithmen erheblich beschleunigt. Diese einfache Änderung kann die Skalierung drastisch verbessern, macht den Algorithmus aber weniger stabil und schwieriger in der Praxis zu verwenden. In diesem Modul werden Sie die praktischen Techniken untersuchen, die erforderlich sind, um den stochastischen Gradienten praktikabel zu machen und so Lernalgorithmen zu erhalten, die auf große Datensätze skalieren. Sie werden sich auch mit einer neuen Art von maschinellem Lernproblem befassen, dem Online-Lernen, bei dem die Daten im Laufe der Zeit einströmen und wir die Koeffizienten lernen müssen, während die Daten eintreffen. Diese Aufgabe kann auch mit stochastischen Gradienten gelöst werden. Sie werden Ihren eigenen stochastischen Gradientenaufstiegsalgorithmus für die logistische Regression von Grund auf implementieren und ihn anhand von Sentiment-Analysedaten bewerten.

Das ist alles enthalten

16 Videos2 Lektüren2 Aufgaben

Dozenten

Lehrkraftbewertungen
4.7 (153 Bewertungen)
Emily Fox
University of Washington
6 Kurse481.146 Lernende
Carlos Guestrin
University of Washington
8 Kurse481.922 Lernende

von

Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

4.7

3.732 Bewertungen

  • 5 stars

    76,76 %

  • 4 stars

    18,59 %

  • 3 stars

    3,05 %

  • 2 stars

    0,61 %

  • 1 star

    0,96 %

Zeigt 3 von 3732 an

EM
4

Geprüft am 14. Apr. 2017

AN
4

Geprüft am 22. Feb. 2018

KL
5

Geprüft am 23. Juni 2017

Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen