In diesem Kurs lernen Sie verschiedene überwachte ML-Algorithmen und Vorhersageaufgaben kennen, die auf unterschiedliche Daten angewendet werden. Sie werden lernen, wann Sie welches Modell verwenden und warum, und wie Sie die Leistung des Modells verbessern können. Wir werden Modelle wie lineare und logistische Regression, KNN, Entscheidungsbäume und Ensembling-Methoden wie Random Forest und Boosting sowie Kernel-Methoden wie SVM behandeln. Vorkenntnisse in Programmierung oder Skripting sind erforderlich. Wir werden während des Kurses ausgiebig mit Python arbeiten. Für diesen Kurs benötigen Sie eine solide Grundlage in Python oder ausreichend Erfahrung in der Programmierung mit anderen Programmiersprachen, um sich schnell in Python einzuarbeiten.
Einführung in das maschinelle Lernen: Überwachtes Lernen
Dieser Kurs ist Teil von Spezialisierung Maschinelles Lernen: Theorie und praktische Anwendung mit Python
Dozent: Geena Kim
14.370 bereits angemeldet
Bei enthalten
(58 Bewertungen)
Empfohlene Erfahrung
Was Sie lernen werden
Verwenden Sie moderne Tools für maschinelles Lernen und Python-Bibliotheken.
Vergleichen Sie die Stärken und Schwächen der logistischen Regression.
Erklären Sie, wie man mit linear untrennbaren Daten umgeht.
Erklären Sie, was ein Entscheidungsbaum ist und wie er Knoten aufteilt.
Kompetenzen, die Sie erwerben
- Kategorie: Hyperparameter
- Kategorie: sklearn
- Kategorie: zusammenstellung
- Kategorie: Entscheidungsbaum
Wichtige Details
Zu Ihrem LinkedIn-Profil hinzufügen
8 Quizzes, 1 Aufgabe
Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.
Erweitern Sie Ihre Fachkenntnisse
- Lernen Sie neue Konzepte von Branchenexperten
- Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
- Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
- Erwerben Sie ein Berufszertifikat zur Vorlage
Erwerben Sie ein Karrierezertifikat.
Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.
Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.
In diesem Kurs gibt es 6 Module
Diese Woche werden wir die Grundlagen des überwachten maschinellen Lernens erarbeiten. Datenbereinigung und EDA mögen nicht glamourös erscheinen, aber der Prozess ist für die Steuerung Ihrer realen Datenprojekte unerlässlich. Die Chancen stehen gut, dass Sie schon einmal von linearer Regression gehört haben. Angesichts des Trubels um das maschinelle Lernen ist es vielleicht überraschend, dass wir mit einer solchen statistischen Standardtechnik beginnen. In "How Not to Be Wrong: The Power of Mathematical Thinking" bezeichnet Jordan Ellenberg die lineare Regression als "die statistische Technik, die für die Sozialwissenschaften das ist, was der Schraubenzieher für die Hausreparatur ist. Es ist das einzige Werkzeug, das Sie so ziemlich immer verwenden werden, egal, um welche Aufgabe es sich handelt" (51). Die lineare Regression ist ein hervorragender Ausgangspunkt für die Lösung von Problemen mit einem kontinuierlichen Ergebnis. Ich hoffe, diese Woche hat Ihnen gezeigt, wie viel Sie mit einem einfachen Modell wie diesem erreichen können.
Das ist alles enthalten
5 Videos12 Lektüren3 Quizzes1 Aufgabe1 Programmieraufgabe1 peer review2 Diskussionsthemen
Diese Woche bauen wir auf den Grundlagen der letzten Woche auf und arbeiten mit komplexeren linearen Regressionsmodellen. Nach dieser Woche werden Sie in der Lage sein, lineare Modelle mit mehreren erklärenden und kategorialen Variablen zu erstellen. Mathematisch und syntaktisch sind multiple lineare Regressionsmodelle eine natürliche Erweiterung der einfacheren linearen Regressionsmodelle, die wir letzte Woche gelernt haben. Einer der Unterschiede, den wir in dieser Woche beachten müssen, ist, dass unser Datenraum jetzt 3D statt 2D ist. Der Unterschied zwischen 3D und 2D hat Auswirkungen auf die Erstellung aussagekräftiger Visualisierungen. Es ist wichtig zu verstehen, wie man Koeffizienten interpretiert. Beim maschinellen Lernen geht es darum, ein Modell strategisch zu iterieren und zu verbessern. In dieser Woche werden Sie im Labor und in der Peer Review Schwachstellen bei linearen Regressionsmodellen identifizieren und diese strategisch verbessern. Wir hoffen, dass Sie diesen iterativen Prozess im Laufe dieses Kurses immer besser beherrschen werden.
Das ist alles enthalten
4 Videos5 Lektüren1 Quiz1 Programmieraufgabe1 peer review
Auch wenn der Name logistische Regression etwas anderes vermuten lässt, werden wir in dieser Woche unsere Aufmerksamkeit von Regressionsaufgaben auf Klassifizierungsaufgaben verlagern. Die logistische Regression ist ein besonderer Fall eines verallgemeinerten linearen Modells. Wie die lineare Regression ist auch die logistische Regression ein weit verbreitetes statistisches Tool und eines der grundlegenden Tools für Ihr Data Science Toolkit. Es gibt viele reale Anwendungen für Klassifizierungsaufgaben, unter anderem im Finanzbereich und in der Biomedizin. In dieser Woche werden Sie sehen, wie dieser klassische Algorithmus Ihnen hilft, vorherzusagen, ob ein Biopsie-Objektträger aus dem berühmten Wisconsin-Brustkrebs-Datensatz eine gutartige oder bösartige Masse aufweist. Wir empfehlen Ihnen auch, in dieser Woche mit dem Abschlussprojekt zu beginnen, das Sie in Woche 7 des Kurses abgeben werden. Suchen Sie diese Woche einen Projektdatensatz, beginnen Sie mit der EDA und definieren Sie Ihr Problem. Nutzen Sie die Projektrubrik als Leitfaden und scheuen Sie sich nicht, sich einige Datensätze anzusehen, bis Sie einen finden, der für das Projekt geeignet ist.
Das ist alles enthalten
4 Videos6 Lektüren1 Quiz1 Programmieraufgabe1 peer review
In dieser Woche lernen wir nicht-parametrische Modelle kennen. k-Nächste Nachbarn macht auf einer intuitiven Ebene Sinn. Entscheidungsbäume sind ein überwachtes Lernmodell, das entweder für Regressions- oder Klassifizierungsaufgaben verwendet werden kann. In Modul 2 haben wir den Kompromiss zwischen Verzerrung und Varianz kennengelernt, und wir haben diesen Kompromiss im Laufe des Kurses im Auge behalten. Hochflexible Baummodelle haben den Vorteil, dass sie komplexe, nicht-lineare Beziehungen erfassen können. Sie sind jedoch anfällig für eine Überanpassung. In dieser und der nächsten Woche werden wir uns mit Strategien wie dem Pruning beschäftigen, um eine Überanpassung mit baumbasierten Modellen zu vermeiden. In dieser Woche werden Sie einen KNN-Klassifikator für den berühmten MNIST-Datensatz erstellen und anschließend einen Spam-Klassifikator mit Hilfe eines Entscheidungsbaummodells entwickeln. In dieser Woche werden wir einmal mehr die Macht einfacher, verständlicher Modelle zu schätzen wissen. Machen Sie weiter mit Ihrem Abschlussprojekt. Sobald Sie Ihren Datensatz und Ihre EDA fertiggestellt haben, beginnen Sie mit dem ersten Ansatz für Ihre Hauptaufgabe des überwachten Lernens. Lesen Sie das Kursmaterial durch, lesen Sie Forschungsarbeiten, schauen Sie sich GitHub-Repositories und Medium-Artikel an, um Ihr Thema zu verstehen und Ihren Ansatz zu planen.
Das ist alles enthalten
5 Videos6 Lektüren1 Quiz1 Programmieraufgabe1 peer review
Letzte Woche haben wir etwas über Baummodelle gelernt. Trotz aller Vorteile von Baummodellen hatten sie einige Schwächen, die schwer zu überwinden waren. Diese Woche werden wir uns mit Ensemble-Methoden befassen, um die Tendenz von Baummodellen zur Überanpassung zu überwinden. Der Gewinner verwendet in vielen Wettbewerben zum maschinellen Lernen einen Ensemble-Ansatz, bei dem die Vorhersagen von mehreren Baummodellen zusammengefasst werden. In dieser Woche werden Sie zunächst etwas über Random Forests und Bagging lernen, eine Technik, bei der derselbe Algorithmus mit verschiedenen Teilmengen der Trainingsdaten trainiert wird. Dann lernen Sie Boosting kennen, eine Ensemble-Methode, bei der die Modelle nacheinander trainiert werden. Sie werden zwei wichtige Boosting-Algorithmen kennenlernen: AdaBoost und Gradient Boosting. In dieser Woche arbeiten Sie an der Hauptanalyse für Ihr Abschlussprojekt. Iterieren und verbessern Sie Ihre Modelle. Vergleichen Sie verschiedene Modelle. Führen Sie eine Optimierung der Hyperparameter durch. Manchmal kann sich dieser Teil eines Projekts zum maschinellen Lernen mühsam anfühlen, aber es wird sich hoffentlich lohnen, wenn Sie sehen, wie sich Ihre Leistung verbessert.
Das ist alles enthalten
4 Videos5 Lektüren1 Quiz1 Programmieraufgabe1 peer review
Diese Woche werden wir uns mit einem weiteren fortgeschrittenen Thema befassen: Support Vector Machines. Lassen Sie sich von dem Namen nicht einschüchtern. In dieser Woche werden wir uns mit diesem leistungsstarken Modell des überwachten Lernens befassen. Wir hoffen, dass Sie ein intuitives Verständnis für die wesentlichen Konzepte wie den Unterschied zwischen harten und weichen Rändern, den Kernel-Trick und die Abstimmung der Hyperparameter entwickeln werden. Nächste Woche werden Sie die drei Ergebnisse Ihres Abschlussprojekts einreichen: den Bericht, die Videopräsentation und einen Link zu Ihrem GitHub-Repository. Nehmen wir an, Sie wollen die Iteration Ihrer Modelle, die Optimierung der Hyperparameter usw. in dieser Woche abschließen. In diesem Fall können Sie in der nächsten Woche Ihrem Bericht den letzten Schliff geben, sicherstellen, dass Ihr GitHub-Repository für die Peer Review bereit ist, und eine hervorragende Präsentation Ihrer Arbeit halten.
Das ist alles enthalten
4 Videos4 Lektüren1 Quiz1 Programmieraufgabe1 peer review
Dozent
Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren
University of Colorado Boulder
University of Colorado Boulder
University of Colorado Boulder
University of Colorado Boulder
Auf einen Abschluss hinarbeiten
Dieses Kurs ist Teil des/der folgenden Studiengangs/Studiengänge, die von University of Colorado Boulderangeboten werden. Wenn Sie zugelassen werden und sich immatrikulieren, können Ihre abgeschlossenen Kurse auf Ihren Studienabschluss angerechnet werden und Ihre Fortschritte können mit Ihnen übertragen werden.¹
Warum entscheiden sich Menschen für Coursera für ihre Karriere?
Bewertungen von Lernenden
Zeigt 3 von 58
58 Bewertungen
- 5 stars
37,28 %
- 4 stars
20,33 %
- 3 stars
8,47 %
- 2 stars
8,47 %
- 1 star
25,42 %
Geprüft am 4. Apr. 2024
Geprüft am 1. Aug. 2023
Geprüft am 20. Mai 2022
Neue Karrieremöglichkeiten mit Coursera Plus
Unbegrenzter Zugang zu über 7.000 erstklassigen Kursen, praktischen Projekten und Zertifikatsprogrammen, die Sie auf den Beruf vorbereiten – alles in Ihrem Abonnement enthalten
Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.
Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online
Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.
Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.
Häufig gestellte Fragen
Ein Cross-Listed-Kurs wird unter zwei oder mehr CU Boulder-Studiengängen auf Coursera angeboten. Zum Beispiel wird Dynamic Programming, Greedy Algorithms sowohl als CSCA 5414 für den MS-CS als auch als DTSA 5503 für den MS-DS angeboten.
- Sie können nicht für mehr als eine Version eines überkreuzten Kurses Punkte sammeln.
- Sie können im Studentenhandbuch Ihres Studiengangs nachsehen, ob es sich um einen Cross-Listed-Kurs handelt.
- Ihr Zeugnis wird davon betroffen sein. Überschneidende Kurse werden bei der Bewertung der Abschlussanforderungen als gleichwertig betrachtet. Wir empfehlen Ihnen jedoch, die von Ihrem Studiengang angebotenen Kurse zu belegen (sofern verfügbar), um sicherzustellen, dass Ihr CU-Zeugnis den erheblichen Umfang der Kursarbeit widerspiegelt, die Sie direkt in Ihrem Heimatfachbereich absolvieren. Alle Kurse, die Sie in einem anderen Studiengang absolvieren, werden auf Ihrem CU-Zeugnis mit dem Kurspräfix des betreffenden Studiengangs aufgeführt (z.B. DTSA vs. CSCA).
- Die Programme können unterschiedliche Mindestanforderungen für die Zulassung und den Abschluss haben. Der MS-DS erfordert zum Beispiel ein C oder besser in allen Kursen für den Abschluss (und ein 3,0 Pathway GPA für die Zulassung), während der MS-CS ein B oder besser in allen Breitenkursen und ein C oder besser in allen Wahlkursen für den Abschluss erfordert (und ein B oder besser in jedem Pathway-Kurs für die Zulassung). Alle Programme verlangen, dass die Studenten für die Zulassung und den Abschluss einen kumulativen GPA von 3,0 erreichen.
Ja. Überkreuzte Kurse werden bei der Bewertung der Abschlussanforderungen als gleichwertig betrachtet. Sie können im Studentenhandbuch Ihres Studiengangs nachsehen, welche Kurse auf der Liste stehen.
Sie können während jeder offenen Einschreibungsperiode ein Upgrade durchführen und die Studiengebühren bezahlen, um eine Anrechnung für << diesen Kurs / diese Kurse in dieser Specialization>> auf Graduate-Ebene der CU Boulder zu erhalten. Da << dieser Kurs / diese Kurse >> sowohl im MS in Computer Science als auch im MS in Data Science Programm aufgelistet sind, müssen Sie vor dem Upgrade festlegen, für welches Programm Sie die Credits erwerben möchten.
MS in Data Science (MS-DS) Credit: Um ein Upgrade auf die anrechenbare Data Science (DTSA)-Version von << diesem Kurs / diesen Kursen >> durchzuführen, verwenden Sie das MS-DS-Anmeldeformular. Siehe Wie es funktioniert.
MS in Computer Science (MS-CS) Credit : Um auf die anrechenbare Computer Science (CSCA) Version von << diesem Kurs / diesen Kursen >> umzusteigen, verwenden Sie das MS-CS Anmeldeformular. Siehe Wie es funktioniert.
Wenn Sie sich nicht sicher sind, welches Programm für Sie am besten geeignet ist, sehen Sie sich die Websites der MS-CS und MS-DS Programme an und kontaktieren Sie datascience@colorado.edu oder mscscoursera-info@colorado.edu, wenn Sie noch Fragen haben.