Fallstudie - Vorhersage von Wohnungspreisen In unserer ersten Fallstudie, der Vorhersage von Wohnungspreisen, werden Sie Modelle erstellen, die einen kontinuierlichen Wert (Preis) anhand von Eingabemerkmalen (Quadratmeterzahl, Anzahl der Schlafzimmer und Bäder,...) vorhersagen. Dies ist nur einer der vielen Anwendungsbereiche für die Regression. Andere Anwendungen reichen von der Vorhersage von Gesundheitsergebnissen in der Medizin, Aktienkursen im Finanzwesen und der Leistungsaufnahme im Hochleistungscomputing bis hin zur Analyse, welche Regulatoren für die Genexpression wichtig sind. In diesem Kurs werden Sie regularisierte lineare Regressionsmodelle für die Aufgabe der Vorhersage und Merkmalsauswahl untersuchen. Sie werden in der Lage sein, mit sehr großen Mengen von Merkmalen umzugehen und zwischen Modellen unterschiedlicher Komplexität zu wählen. Sie werden auch die Auswirkungen von Aspekten Ihrer Daten - wie z.B. Ausreißern - auf die von Ihnen ausgewählten Modelle und Vorhersagen analysieren. Um diese Modelle anzupassen, werden Sie Optimierungsalgorithmen implementieren, die für große Datensätze geeignet sind. Lernergebnisse: Am Ende dieses Kurses werden Sie in der Lage sein: -Beschreiben Sie die Eingabe und Ausgabe eines Regressionsmodells. -Vergleichen und kontrastieren Sie Bias und Varianz bei der Modellierung von Daten. -Schätzen Sie die Modellparameter mit Hilfe von Optimierungsalgorithmen. -Stimmen Sie die Parameter mit Kreuzvalidierung ab. -Analysieren Sie die Leistung des Modells. -Beschreiben Sie den Begriff der Sparsamkeit und wie LASSO zu spärlichen Lösungen führt. -Wenden Sie Methoden an, um zwischen Modellen auszuwählen. -Nutzen Sie das Modell für Vorhersagen.
Maschinelles Lernen: Regression
Dieser Kurs ist Teil von Spezialisierung Maschinelles Lernen
Dozenten: Emily Fox
162.692 bereits angemeldet
Bei enthalten
(5,571 Bewertungen)
Kompetenzen, die Sie erwerben
- Kategorie: Lineare Regression
- Kategorie: Ridge Regression
- Kategorie: Lasso (Statistik)
- Kategorie: Regressionsanalyse
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
15 Aufgaben
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 8 Module
Die Regression ist eines der wichtigsten und am weitesten verbreiteten Tools für maschinelles Lernen und Statistik. Sie ermöglicht es Ihnen, Vorhersagen aus Daten zu treffen, indem Sie die Beziehung zwischen den Merkmalen Ihrer Daten und einer beobachteten, kontinuierlich bewerteten Reaktion lernen. Die Regression wird in einer Vielzahl von Anwendungen eingesetzt, die von der Vorhersage von Aktienkursen bis zum Verständnis von Genregulationsnetzwerken reichen.<p>Diese Einführung in den Kurs gibt Ihnen einen Überblick über die Themen, die wir behandeln werden, sowie über das Hintergrundwissen und die Ressourcen, die wir bei Ihnen voraussetzen.
Das ist alles enthalten
5 Videos4 Lektüren
Unser Kurs beginnt mit dem grundlegendsten Regressionsmodell: Die einfache Anpassung einer Linie an die Daten. Dieses einfache Modell zur Bildung von Vorhersagen aus einem einzigen, univariaten Merkmal der Daten wird passenderweise "einfache lineare Regression" genannt.<p> In diesem Modul beschreiben wir die Regressionsaufgabe auf hoher Ebene und spezialisieren diese Konzepte dann auf den Fall der einfachen linearen Regression. Sie lernen, wie man ein einfaches Regressionsmodell formuliert und das Modell an die Daten anpasst, indem man sowohl eine geschlossene Lösung als auch einen iterativen Optimierungsalgorithmus namens Gradientenabstieg verwendet. Auf der Grundlage dieser angepassten Funktion werden Sie die geschätzten Modellparameter interpretieren und Vorhersagen treffen. Sie werden auch die Sensitivität Ihrer Anpassung auf abweichende Beobachtungen analysieren.<p> Sie werden all diese Konzepte im Rahmen einer Fallstudie zur Vorhersage von Hauspreisen anhand der Quadratmeterzahl des Hauses untersuchen.
Das ist alles enthalten
25 Videos5 Lektüren2 Aufgaben
Der nächste Schritt, um über die einfache lineare Regression hinauszugehen, ist die "multiple Regression", bei der mehrere Merkmale der Daten verwendet werden, um Vorhersagen zu treffen. <p>Genauer gesagt, lernen Sie in diesem Modul, wie Sie Modelle für komplexere Beziehungen zwischen einer einzelnen Variablen (z.B. "Quadratfuß") und der beobachteten Antwort (wie "Hausverkaufspreis") erstellen können. Dazu gehört z.B. die Anpassung eines Polynoms an Ihre Daten oder die Erfassung von saisonalen Veränderungen im Antwortwert. Sie werden auch lernen, wie Sie mehrere Eingabevariablen (z.B. 'Quadratmeter', 'Anzahl der Schlafzimmer', 'Anzahl der Badezimmer') einbeziehen können. Sie werden dann in der Lage sein zu beschreiben, wie all diese Modelle immer noch in den Rahmen der linearen Regression eingebettet werden können, aber jetzt unter Verwendung mehrerer "Merkmale". Innerhalb dieses Rahmens der multiplen Regression werden Sie die Modelle an die Daten anpassen, die geschätzten Koeffizienten interpretieren und Vorhersagen treffen. <p>Hier werden Sie auch einen Gradientenabstiegsalgorithmus zur Anpassung eines multiplen Regressionsmodells implementieren.
Das ist alles enthalten
19 Videos5 Lektüren3 Aufgaben
Nachdem Sie sich mit linearen Regressionsmodellen und Algorithmen zur Schätzung der Parameter solcher Modelle vertraut gemacht haben, sind Sie nun in der Lage zu beurteilen, wie gut die von Ihnen gewählte Methode bei der Vorhersage neuer Daten funktionieren sollte. Sie sind auch in der Lage, unter den möglichen Modellen das leistungsfähigste auszuwählen. <p>In diesem Modul geht es um diese wichtigen Themen der Modellauswahl und -bewertung. Sie werden sowohl theoretische als auch praktische Aspekte solcher Analysen untersuchen. Zunächst werden Sie sich mit dem Konzept der Messung des "Verlusts" Ihrer Vorhersagen befassen und dies nutzen, um Trainings-, Test- und Generalisierungsfehler zu definieren. Für diese Fehlermessungen werden Sie analysieren, wie sie mit der Modellkomplexität variieren und wie sie für eine valide Bewertung der Vorhersageleistung genutzt werden können. Dies führt direkt zu einem wichtigen Gespräch über den Kompromiss zwischen Verzerrung und Varianz, der für das maschinelle Lernen grundlegend ist. Schließlich werden Sie eine Methode entwickeln, um zunächst eine Auswahl unter den Modellen zu treffen und dann die Leistung des ausgewählten Modells zu bewerten. <p>Die in diesem Modul beschriebenen Konzepte sind der Schlüssel zu allen Problemen des maschinellen Lernens, die weit über die in diesem Kurs behandelte Regression hinausgehen.
Das ist alles enthalten
14 Videos2 Lektüren2 Aufgaben
Sie haben untersucht, wie die Leistung eines Modells mit zunehmender Modellkomplexität variiert, und können die potenzielle Gefahr beschreiben, dass komplexe Modelle zu stark an die Trainingsdaten angepasst werden. In diesem Modul werden Sie eine sehr einfache, aber äußerst effektive Technik zur automatischen Bewältigung dieses Problems kennenlernen. Diese Methode nennt sich "Ridge Regression". Sie beginnen mit einem komplexen Modell, passen das Modell aber so an, dass nicht nur ein Maß für die Anpassung an die Trainingsdaten, sondern auch ein Term, der die Lösung von überangepassten Funktionen ablenkt, einbezogen wird. Zu diesem Zweck werden Sie die Symptome von überangepassten Funktionen erforschen und dies nutzen, um ein quantitatives Maß zu definieren, das Sie in Ihrem überarbeiteten Optimierungsziel verwenden können. Sie werden sowohl einen Algorithmus in geschlossener Form als auch einen Gradientenabstiegsalgorithmus für die Anpassung des Ridge-Regressionsziels ableiten. Diese Formen sind kleine Modifikationen der ursprünglichen Algorithmen, die Sie für die multiple Regression abgeleitet haben. Um die Stärke der Verzerrung weg von der Überanpassung auszuwählen, werden Sie eine Allzweckmethode namens "Kreuzvalidierung" untersuchen. <p>Sie werden sowohl die Kreuzvalidierung als auch den Gradientenabstieg implementieren, um ein Ridge-Regressionsmodell anzupassen und die Regularisierungskonstante auszuwählen.
Das ist alles enthalten
16 Videos5 Lektüren3 Aufgaben
Eine grundlegende Aufgabe des maschinellen Lernens besteht darin, aus einer Reihe von Merkmalen auszuwählen, die in ein Modell aufgenommen werden sollen. In diesem Modul werden Sie diese Idee im Kontext der multiplen Regression untersuchen und beschreiben, wie wichtig eine solche Merkmalsauswahl sowohl für die Interpretierbarkeit als auch für die Effizienz der Vorhersagen ist. <p>Zu Beginn werden Sie Methoden untersuchen, die eine Aufzählung von Modellen mit verschiedenen Teilmengen von Merkmalen durchsuchen. Sie werden sowohl die erschöpfende Suche als auch gierige Algorithmen analysieren. Dann wenden wir uns anstelle einer expliziten Aufzählung der Lasso-Regression zu, die implizit eine Merkmalsauswahl ähnlich wie die Ridge-Regression vornimmt: Ein komplexes Modell wird auf der Grundlage eines Maßes für die Anpassung an die Trainingsdaten sowie eines Maßes für die Überanpassung angepasst, das sich von dem bei der Ridge-Regression verwendeten unterscheidet. Diese Lasso-Methode hat sich in zahlreichen Anwendungsbereichen durchgesetzt, und die Ideen hinter der Methode haben das maschinelle Lernen und die Statistik grundlegend verändert. Sie werden auch einen Koordinatenabstiegsalgorithmus für die Anpassung eines Lasso-Modells implementieren. <p>Koordinatenabstieg ist eine weitere, allgemeine Optimierungstechnik, die in vielen Bereichen des maschinellen Lernens nützlich ist.
Das ist alles enthalten
22 Videos4 Lektüren3 Aufgaben
Bis zu diesem Punkt haben wir uns auf Methoden konzentriert, die parametrische Funktionen - wie Polynome und Hyperebenen - an den gesamten Datensatz anpassen. In diesem Modul richten wir unsere Aufmerksamkeit stattdessen auf eine Klasse von "nichtparametrischen" Methoden. Diese Methoden erlauben es, die Komplexität des Modells zu erhöhen, wenn mehr Daten beobachtet werden, und führen zu Anpassungen, die sich lokal an die Beobachtungen anpassen. <p>Zunächst betrachten wir das einfache und intuitive Beispiel für nichtparametrische Methoden, die Regression der nächsten Nachbarn: Die Vorhersage für einen Abfragepunkt basiert auf den Ergebnissen der am meisten verwandten Beobachtungen im Trainingssatz. Dieser Ansatz ist extrem einfach, kann aber hervorragende Vorhersagen liefern, insbesondere bei großen Datensätzen. Sie setzen Algorithmen ein, um nach den nächsten Nachbarn zu suchen und auf der Grundlage der entdeckten Nachbarn Vorhersagen zu treffen. Auf dieser Idee aufbauend, wenden wir uns der Kernel-Regression zu. Anstatt Vorhersagen auf der Grundlage einer kleinen Gruppe von Nachbarbeobachtungen zu treffen, werden bei der Kernel-Regression alle Beobachtungen im Datensatz verwendet, wobei der Einfluss dieser Beobachtungen auf den vorhergesagten Wert nach ihrer Ähnlichkeit mit dem Abfragepunkt gewichtet wird. Sie werden die theoretische Leistung dieser Methoden bei einer unendlichen Anzahl von Trainingsdaten analysieren und die Szenarien untersuchen, in denen diese Methoden gut oder schlecht funktionieren. Sie werden diese Techniken auch implementieren und ihr praktisches Verhalten beobachten.
Das ist alles enthalten
13 Videos2 Lektüren2 Aufgaben
Zum Abschluss des Kurses rekapitulieren wir, was wir behandelt haben. Dabei geht es sowohl um regressionsspezifische Techniken als auch um grundlegende Konzepte des maschinellen Lernens, die in der gesamten Spezialisierung vorkommen werden. Wir gehen auch kurz auf einige wichtige Regressionstechniken ein, die wir in diesem Kurs nicht behandelt haben.<p> Wir schließen mit einem Überblick über das, was Sie im weiteren Verlauf der Spezialisierung erwartet.
Das ist alles enthalten
5 Videos1 Lektüre
Dozenten
Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren
University of Illinois Urbana-Champaign
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
5.571 Bewertungen
- 5 stars
80,97 %
- 4 stars
15,86 %
- 3 stars
1,88 %
- 2 stars
0,44 %
- 1 star
0,82 %
Zeigt 3 von 5571 an
Geprüft am 16. März 2016
I really enjoyed all the concepts and implementations I did along this course....except during the Lasso module. I found this module harder than the others but very interesting as well. Great course!
Geprüft am 6. Apr. 2016
This is an excellent course. The presentation is clear, the graphs are very informative, the homework is well-structured and it does not beat around the bush with unnecessary theoretical tangents.
Geprüft am 30. Aug. 2016
it's a nice course. I have learnt many new concepts. I am from information systems background and want my career towards data science. This course helped me a lot in learning new concepts.
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Der Zugang zu Vorlesungen und Aufgaben hängt von der Art Ihrer Einschreibung ab. Wenn Sie einen Kurs im Prüfungsmodus belegen, können Sie die meisten Kursmaterialien kostenlos einsehen. Um auf benotete Aufgaben zuzugreifen und ein Zertifikat zu erwerben, müssen Sie die Zertifikatserfahrung während oder nach Ihrer Prüfung erwerben. Wenn Sie die Prüfungsoption nicht sehen:
Der Kurs bietet möglicherweise keine Prüfungsoption. Sie können stattdessen eine kostenlose Testversion ausprobieren oder finanzielle Unterstützung beantragen.
Der Kurs bietet möglicherweise stattdessen die Option 'Vollständiger Kurs, kein Zertifikat'. Mit dieser Option können Sie alle Kursmaterialien einsehen, die erforderlichen Bewertungen abgeben und eine Abschlussnote erhalten. Dies bedeutet auch, dass Sie kein Zertifikat erwerben können.
Wenn Sie sich für den Kurs einschreiben, erhalten Sie Zugang zu allen Kursen der Specializations, und Sie erhalten ein Zertifikat, wenn Sie die Arbeit abgeschlossen haben. Ihr elektronisches Zertifikat wird Ihrer Erfolgsseite hinzugefügt - von dort aus können Sie Ihr Zertifikat ausdrucken oder zu Ihrem LinkedIn-Profil hinzufügen. Wenn Sie die Kursinhalte nur lesen und ansehen möchten, können Sie den Kurs kostenlos besuchen.
Wenn Sie ein Abonnement abgeschlossen haben, erhalten Sie eine kostenlose 7-tägige Testphase, in der Sie kostenlos kündigen können. Danach gewähren wir keine Rückerstattung, aber Sie können Ihr Abonnement jederzeit kündigen. Siehe unsere vollständigen Rückerstattungsbedingungen.