Fallstudien: Analyse von Stimmungen & Vorhersage von Kreditausfällen In unserer Fallstudie zur Analyse von Stimmungen erstellen Sie Modelle, die eine Klasse (positive/negative Stimmung) anhand von Eingabemerkmalen (Text der Bewertungen, Benutzerprofilinformationen,...) vorhersagen. In unserer zweiten Fallstudie für diesen Kurs, der Vorhersage von Kreditausfällen, werden Sie sich mit Finanzdaten beschäftigen und vorhersagen, wann ein Kredit für die Bank wahrscheinlich riskant oder sicher ist. Diese Aufgaben sind Beispiele für die Klassifizierung, eines der am häufigsten verwendeten Gebiete des maschinellen Lernens mit einer breiten Palette von Anwendungen, darunter Ad Targeting, Spam-Erkennung, medizinische Diagnose und Bildklassifizierung.
Schenken Sie Ihrer Karriere Coursera Plus mit einem Rabatt von $160 , der jährlich abgerechnet wird. Sparen Sie heute.
Maschinelles Lernen: Klassifizierung
Dieser Kurs ist Teil von Spezialisierung Maschinelles Lernen
Dozenten: Emily Fox
126.539 bereits angemeldet
Bei enthalten
(3,731 Bewertungen)
Kompetenzen, die Sie erwerben
- Kategorie: Logistische Regression
- Kategorie: Statistische Klassifizierung
- Kategorie: Klassifizierungsalgorithmen
- Kategorie: Entscheidungsbaum
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
19 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 10 Module
Die Klassifizierung ist eine der am weitesten verbreiteten Techniken im Bereich des maschinellen Lernens mit einer breiten Palette von Anwendungen, darunter Sentimentanalyse, Werbezielgruppenansprache, Spam-Erkennung, Risikobewertung, medizinische Diagnose und Bildklassifizierung. Das Hauptziel der Klassifizierung ist die Vorhersage einer Kategorie oder Klasse y aus einigen Eingaben x. In diesem Kurs werden Sie mit den grundlegenden Modellen und Algorithmen vertraut gemacht, die bei der Klassifizierung verwendet werden, sowie mit einer Reihe von Kernkonzepten des maschinellen Lernens. Sie werden nicht alle Aspekte der Klassifizierung abdecken, sondern sich auf einige wenige Kerntechniken konzentrieren, die in der Praxis häufig eingesetzt werden, um Spitzenleistungen zu erzielen. Indem Sie unserem praktischen Ansatz folgen, werden Sie Ihre eigenen Algorithmen in mehreren realen Aufgabenstellungen implementieren und die Kerntechniken, die Sie benötigen, um mit diesen Ansätzen in der Praxis erfolgreich zu sein, gründlich verstehen. Diese Einführung in den Kurs gibt Ihnen einen Überblick über die Themen, die wir behandeln werden, sowie über das Hintergrundwissen und die Ressourcen, die wir bei Ihnen voraussetzen.
Das ist alles enthalten
8 Videos4 Lektüren
Lineare Klassifikatoren gehören zu den praktischsten Klassifizierungsmethoden. In unserer Fallstudie zur Stimmungsanalyse assoziiert ein linearer Klassifikator zum Beispiel einen Koeffizienten mit der Anzahl der einzelnen Wörter im Satz. In diesem Modul werden Sie mit dieser Art der Darstellung vertraut gemacht. Sie werden sich auf einen besonders nützlichen Typ von linearem Klassifikator, die logistische Regression, konzentrieren, die Ihnen nicht nur die Vorhersage einer Klasse ermöglicht, sondern auch eine mit der Vorhersage verbundene Wahrscheinlichkeit liefert. Diese Wahrscheinlichkeiten sind äußerst nützlich, da sie ein gewisses Maß an Vertrauen in die Vorhersagen vermitteln. In diesem Modul werden Sie auch in der Lage sein, Merkmale aus kategorialen Eingaben zu konstruieren und Klassifizierungsprobleme mit mehr als zwei Klassen (Multiklassenprobleme) zu bewältigen. Sie werden die Ergebnisse dieser Techniken anhand einer realen Aufgabe zur Stimmungsanalyse von Produkten untersuchen.
Das ist alles enthalten
18 Videos2 Lektüren2 Aufgaben
Nachdem Sie sich mit linearen Klassifikatoren und logistischer Regression vertraut gemacht haben, können Sie jetzt eintauchen und Ihren ersten Lernalgorithmus für die Klassifizierung schreiben. Insbesondere werden Sie Gradient Ascent verwenden, um die Koeffizienten Ihres Klassifikators aus den Daten zu lernen. Zunächst müssen Sie die Qualitätsmetrik für diese Aufgaben mithilfe eines Ansatzes namens Maximum Likelihood Estimation (MLE) definieren. Sie werden auch mit einer einfachen Technik zur Auswahl der Schrittgröße für den Gradientenanstieg vertraut gemacht. Ein optionaler, fortgeschrittener Teil dieses Moduls behandelt die Ableitung des Gradienten für die logistische Regression. Sie werden Ihren eigenen Lernalgorithmus für die logistische Regression von Grund auf implementieren und ihn verwenden, um einen Klassifikator für die Stimmungsanalyse zu lernen.
Das ist alles enthalten
18 Videos2 Lektüren2 Aufgaben
Wie wir im Regressionskurs gesehen haben, ist die Überanpassung vielleicht die größte Herausforderung, mit der Sie konfrontiert werden, wenn Sie Ansätze des maschinellen Lernens in der Praxis anwenden. Diese Herausforderung kann bei der logistischen Regression besonders groß sein, wie Sie in diesem Modul feststellen werden, da wir nicht nur riskieren, eine zu komplexe Entscheidungsgrenze zu erhalten, sondern Ihr Klassifikator auch zu viel Vertrauen in die von ihm vorhergesagten Wahrscheinlichkeiten gewinnen kann. In diesem Modul werden Sie sich eingehend mit der Überanpassung bei der Klassifizierung befassen und anhand einiger interessanter Visualisierungen der Ergebnisse der Klassifizierer umfassende praktische Erkenntnisse gewinnen. Anschließend werden Sie einen Regularisierungsterm zu Ihrer Optimierung hinzufügen, um das Overfitting zu verringern. Sie werden sowohl die L2-Regularisierung untersuchen, um große Koeffizientenwerte zu bestrafen, als auch die L1-Regularisierung, um zusätzliche Sparsamkeit in den Koeffizienten zu erreichen. Schließlich werden Sie Ihren Gradientenanstiegsalgorithmus modifizieren, um regularisierte logistische Regressionsklassifikatoren zu lernen. Sie werden Ihren eigenen regularisierten logistischen Regressionsklassifikator von Grund auf implementieren und die Auswirkungen der L2-Strafe auf reale Stimmungsanalysedaten untersuchen.
Das ist alles enthalten
13 Videos2 Lektüren2 Aufgaben
Zusammen mit linearen Klassifizierern gehören Entscheidungsbäume zu den am häufigsten verwendeten Klassifizierungstechniken in der realen Welt. Diese Methode ist äußerst intuitiv, einfach zu implementieren und liefert interpretierbare Vorhersagen. In diesem Modul machen Sie sich mit der zentralen Darstellung von Entscheidungsbäumen vertraut. Anschließend werden Sie einen einfachen, rekursiven Greedy-Algorithmus entwerfen, um Entscheidungsbäume aus Daten zu lernen. Schließlich werden Sie diesen Ansatz erweitern, um mit kontinuierlichen Eingaben umgehen zu können, eine grundlegende Voraussetzung für praktische Probleme. In diesem Modul werden Sie eine brandneue Fallstudie aus dem Finanzsektor untersuchen: die Vorhersage des mit einem Bankkredit verbundenen Risikos. Sie werden Ihren eigenen Entscheidungsbaum-Lernalgorithmus auf realen Kreditdaten implementieren.
Das ist alles enthalten
13 Videos3 Lektüren3 Aufgaben
Von allen Techniken des maschinellen Lernens sind Entscheidungsbäume mit am anfälligsten für Overfitting. Keine praktische Implementierung ist möglich, ohne Ansätze einzubeziehen, die diese Herausforderung abmildern. In diesem Modul werden Sie anhand verschiedener Visualisierungen und Untersuchungen untersuchen, warum Entscheidungsbäume unter erheblichen Overfitting-Problemen leiden. Unter Anwendung des Prinzips von Occams Rasiermesser werden Sie die Überanpassung durch das Lernen einfacherer Bäume abmildern. Zunächst werden Sie Algorithmen entwerfen, die den Lernprozess stoppen, bevor die Entscheidungsbäume übermäßig komplex werden. In einem optionalen Abschnitt werden Sie einen sehr praktischen Ansatz entwerfen, der einen übermäßig komplexen Baum lernt und ihn dann durch Beschneidung vereinfacht. Ihre Implementierung wird die Auswirkungen dieser Techniken auf die Abschwächung von Overfitting an unserem realen Darlehensdatensatz untersuchen.
Das ist alles enthalten
8 Videos2 Lektüren2 Aufgaben
Bei Problemen des maschinellen Lernens in der realen Welt gibt es viele fehlende Daten. Das heißt, sehr oft werden einige der Eingaben nicht für alle Datenpunkte beobachtet. Dies ist eine sehr große Herausforderung, die in den meisten Fällen auftritt und sorgfältig behandelt werden muss, um eine gute Leistung zu erzielen. Dieses Thema wird in Kursen zum maschinellen Lernen nur selten behandelt. In diesem Modul werden Sie das Problem der fehlenden Daten direkt angehen. Sie beginnen mit den beiden grundlegendsten Techniken zur Umwandlung eines Datensatzes mit fehlenden Daten in einen sauberen Datensatz, nämlich dem Überspringen fehlender Werte und der Eingabe fehlender Werte. In einem fortgeschrittenen Abschnitt werden Sie außerdem eine Modifikation des Entscheidungsbaum-Lernalgorithmus entwerfen, die Entscheidungen über fehlende Daten direkt in das Modell einbaut. Sie werden diese Techniken auch in Ihrer Implementierung mit echten Daten erproben.
Das ist alles enthalten
6 Videos1 Lektüre1 Aufgabe
Eine der spannendsten theoretischen Fragen im Bereich des maschinellen Lernens ist, ob einfache Klassifikatoren zu einem hochpräzisen Ensemble kombiniert werden können. Diese Frage führte zur Entwicklung von Boosting, einer der wichtigsten und praktischsten Techniken des maschinellen Lernens heute. Dieser einfache Ansatz kann die Genauigkeit eines beliebigen Klassifizierers erhöhen und wird in der Praxis häufig verwendet, z.B. von mehr als der Hälfte der Teams, die die Kaggle-Wettbewerbe für maschinelles Lernen gewinnen. In diesem Modul werden Sie zunächst den Ensemble-Klassifikator definieren, bei dem mehrere Modelle über die beste Vorhersage abstimmen. Anschließend werden Sie einen Boosting-Algorithmus namens AdaBoost kennenlernen, der einen hervorragenden Ansatz für das Boosten von Klassifikatoren bietet. Anhand von Visualisierungen werden Sie viele der praktischen Aspekte dieser Technik kennenlernen. Sie werden Ihre eigene Implementierung von AdaBoost von Grund auf neu erstellen und damit die Leistung Ihres Kreditrisikoprädiktors auf realen Daten steigern.
Das ist alles enthalten
13 Videos3 Lektüren3 Aufgaben
In vielen realen Situationen sind Genauigkeit oder Fehler nicht die besten Qualitätsmaßstäbe für die Klassifizierung. Sie werden eine Fallstudie untersuchen, die dieses Problem deutlich macht: die Verwendung der Stimmungsanalyse zur Anzeige positiver Bewertungen auf einer Restaurant-Website. Anstelle von Genauigkeit werden Sie zwei Metriken definieren: Präzision und Recall, die in der Praxis häufig verwendet werden, um die Qualität von Klassifizierern zu messen. Sie werden untersuchen, wie die von Ihrem Klassifikator ausgegebenen Wahrscheinlichkeiten verwendet werden können, um Präzision und Recall gegeneinander abzuwägen, und Sie werden dieses Spektrum anhand von Präzisions-Recall-Kurven untersuchen. In Ihrer praktischen Implementierung werden Sie diese Metriken mit Ihrem gelernten Klassifikator auf realen Sentimentanalyse-Daten berechnen.
Das ist alles enthalten
8 Videos2 Lektüren2 Aufgaben
Mit dem Aufkommen des Internets, dem Wachstum der sozialen Medien und der Einbettung von Sensoren in der Welt sind die Datenmengen, die unsere Algorithmen für maschinelles Lernen verarbeiten müssen, im letzten Jahrzehnt enorm gewachsen. Dieser Effekt wird manchmal als "Big Data" bezeichnet. Daher müssen unsere Lernalgorithmen auf immer größere Datensätze skalieren. In diesem Modul werden Sie eine kleine Abwandlung des Gradientenaufstiegs, den stochastischen Gradienten, entwickeln, der die Laufzeit unserer Algorithmen erheblich beschleunigt. Diese einfache Änderung kann die Skalierung drastisch verbessern, macht den Algorithmus aber weniger stabil und schwieriger in der Praxis zu verwenden. In diesem Modul werden Sie die praktischen Techniken untersuchen, die erforderlich sind, um den stochastischen Gradienten praktikabel zu machen und so Lernalgorithmen zu erhalten, die auf große Datensätze skalieren. Sie werden sich auch mit einer neuen Art von maschinellem Lernproblem befassen, dem Online-Lernen, bei dem die Daten im Laufe der Zeit einströmen und wir die Koeffizienten lernen müssen, während die Daten eintreffen. Diese Aufgabe kann auch mit stochastischen Gradienten gelöst werden. Sie werden Ihren eigenen stochastischen Gradientenaufstiegsalgorithmus für die logistische Regression von Grund auf implementieren und ihn anhand von Sentiment-Analysedaten bewerten.
Das ist alles enthalten
16 Videos2 Lektüren2 Aufgaben
Dozenten
Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren
Amazon Web Services
University of Illinois Urbana-Champaign
Wesleyan University
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
Zeigt 3 von 3731
3.731 Bewertungen
- 5 stars
76,76 %
- 4 stars
18,60 %
- 3 stars
3,05 %
- 2 stars
0,61 %
- 1 star
0,96 %
Geprüft am 19. Okt. 2020
Geprüft am 8. Feb. 2017
Geprüft am 22. Aug. 2017
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Einschreibung ab. Wenn Sie einen Kurs im Prüfungsmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung während oder nach Ihrer Prüfung erwerben. Wenn Sie die Prüfungsoption nicht sehen:
Der Kurs bietet möglicherweise keine Prüfungsoption. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
Der Kurs bietet möglicherweise stattdessen die Option 'Vollständiger Kurs, kein Zertifikat'. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Specializations, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen. Wenn Sie die Kursinhalte nur lesen und ansehen möchten, können Sie den Kurs kostenlos besuchen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-tägige Testphase, in der Sie kostenlos kündigen können. Danach gewähren wir keine Rückerstattung, aber Sie können Ihr Abonnement jederzeit kündigen. Siehe unsere vollständigen Rückerstattungsbedingungen.