Wesleyan University
Maschinelles Lernen für die Datenanalyse
Wesleyan University

Maschinelles Lernen für die Datenanalyse

Jen Rose
Lisa Dierker

Dozenten: Jen Rose

45.499 bereits angemeldet

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.2

(323 Bewertungen)

Es dauert 10 Stunden
3 Wochen bei 3 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
95%
Den meisten Lernenden hat dieser Kurs gefallen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
4.2

(323 Bewertungen)

Es dauert 10 Stunden
3 Wochen bei 3 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
95%
Den meisten Lernenden hat dieser Kurs gefallen

Kompetenzen, die Sie erwerben

  • Kategorie: Datenanalyse
  • Kategorie: Python-Programmierung
  • Kategorie: Maschinelles Lernen
  • Kategorie: Explorative Datenanalyse

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Datenanalyse und Interpretation
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 4 Module

In dieser Sitzung lernen Sie Entscheidungsbäume kennen, eine Art von Data-Mining-Algorithmus, der aus einer großen Anzahl von Variablen diejenigen und deren Interaktionen auswählen kann, die für die Vorhersage der zu erklärenden Ziel- oder Antwortvariablen am wichtigsten sind. Entscheidungsbäume erstellen Segmentierungen oder Untergruppen in den Daten, indem sie eine Reihe von einfachen Regeln oder Kriterien immer wieder anwenden, die die Variablenkonstellationen auswählen, die die Zielvariable am besten vorhersagen.

Das ist alles enthalten

7 Videos15 Lektüren1 peer review

In dieser Sitzung lernen Sie zufällige Wälder kennen, eine Art von Data-Mining-Algorithmus, der aus einer großen Anzahl von Variablen diejenigen auswählen kann, die bei der Bestimmung der zu erklärenden Ziel- oder Antwortvariablen am wichtigsten sind. Im Gegensatz zu Entscheidungsbäumen lassen sich die Ergebnisse von Random Forests gut auf neue Daten verallgemeinern.

Das ist alles enthalten

4 Videos4 Lektüren1 peer review

Die Lasso-Regressionsanalyse ist eine Schrumpfungs- und Variablenauswahlmethode für lineare Regressionsmodelle. Das Ziel der Lasso-Regression ist es, die Teilmenge der Prädiktoren zu erhalten, die den Vorhersagefehler für eine quantitative Antwortvariable minimiert. Das Lasso erreicht dies, indem es den Modellparametern eine Beschränkung auferlegt, die dazu führt, dass die Regressionskoeffizienten für einige Variablen gegen Null schrumpfen. Variablen mit einem Regressionskoeffizienten von Null nach dem Schrumpfungsprozess werden aus dem Modell ausgeschlossen. Variablen mit Regressionskoeffizienten ungleich Null sind am stärksten mit der Antwortvariablen assoziiert. Erklärende Variablen können entweder quantitativ, kategorial oder beides sein. In dieser Sitzung werden Sie eine Lasso-Regressionsanalyse anwenden und interpretieren. Sie werden auch Erfahrungen mit der k-fachen Kreuzvalidierung sammeln, um das am besten passende Modell auszuwählen und eine genauere Schätzung der Testfehlerrate Ihres Modells zu erhalten. Um ein Lasso-Regressionsmodell zu testen, müssen Sie eine quantitative Antwortvariable aus Ihrem Datensatz identifizieren, falls Sie dies noch nicht getan haben, und einige zusätzliche quantitative und kategoriale Prädiktorvariablen (d.h. erklärende Variablen) auswählen, um einen größeren Pool von Prädiktoren zu entwickeln. Mit einer größeren Anzahl von Prädiktoren, die Sie testen können, können Sie Ihre Erfahrungen mit der Lasso-Regressionsanalyse maximieren. Denken Sie daran, dass es sich bei der Lasso-Regression um eine Methode des maschinellen Lernens handelt, so dass Ihre Auswahl zusätzlicher Prädiktoren nicht unbedingt von einer Forschungshypothese oder Theorie abhängen muss. Gehen Sie ein paar Risiken ein und probieren Sie einige neue Variablen aus. Die Lasso-Regressionsanalyse wird Ihnen helfen zu bestimmen, welche Ihrer Prädiktoren am wichtigsten sind. Beachten Sie auch, dass Sie, wenn Sie mit einem relativ kleinen Datensatz arbeiten, Ihre Daten nicht in Trainings- und Testdatensätze aufteilen müssen. Die von Ihnen angewandte Methode der Kreuzvalidierung ist so konzipiert, dass Sie Ihre Daten nicht aufteilen müssen, wenn Sie eine begrenzte Anzahl von Beobachtungen haben.

Das ist alles enthalten

5 Videos3 Lektüren1 peer review

Die Clusteranalyse ist eine unüberwachte Methode des maschinellen Lernens, die die Beobachtungen in einem Datensatz in eine kleinere Gruppe von Clustern unterteilt, wobei jede Beobachtung nur zu einem Cluster gehört. Das Ziel der Clusteranalyse ist es, Beobachtungen auf der Grundlage der Ähnlichkeit ihrer Antworten auf mehrere Variablen in Teilmengen zu gruppieren oder zu clustern. Bei den Clustervariablen sollte es sich in erster Linie um quantitative Variablen handeln, aber auch binäre Variablen können einbezogen werden. In dieser Sitzung werden wir Ihnen zeigen, wie Sie die k-means Clusteranalyse verwenden, um Cluster von Beobachtungen in Ihrem Datensatz zu identifizieren. Sie werden Erfahrungen mit der Interpretation der Ergebnisse der Clusteranalyse sammeln, indem Sie grafische Methoden verwenden, um die Anzahl der zu interpretierenden Cluster zu bestimmen, und die Mittelwerte der Clustervariablen untersuchen, um die Clusterprofile zu bewerten. Schließlich erhalten Sie die Möglichkeit, Ihre Clusterlösung zu validieren, indem Sie die Unterschiede zwischen den Clustern in Bezug auf eine Variable untersuchen, die nicht in Ihrer Clusteranalyse enthalten ist. Sie können die gleichen Variablen, die Sie in den vergangenen Wochen verwendet haben, als Clustervariablen verwenden. Wenn die meisten oder alle Ihrer bisherigen erklärenden Variablen kategorisch sind, sollten Sie einige zusätzliche quantitative Clustervariablen aus Ihrem Datensatz identifizieren. Idealerweise sind die meisten Ihrer Clustering-Variablen quantitativ, obwohl Sie auch einige binäre Variablen einbeziehen können. Darüber hinaus müssen Sie eine quantitative oder binäre Antwortvariable aus Ihrem Datensatz identifizieren, die Sie nicht in Ihre Clusteranalyse einbeziehen werden. Sie werden diese Variable verwenden, um Ihre Cluster zu validieren, indem Sie mit Hilfe von statistischen Methoden wie der Varianzanalyse oder der Chi-Quadrat-Analyse, die Sie in Kurs 2 der Spezialisierung (Datenanalyse-Tools) kennengelernt haben, bewerten, ob sich Ihre Cluster bei dieser Antwortvariable signifikant unterscheiden. Beachten Sie auch, dass Sie, wenn Sie mit einem relativ kleinen Datensatz arbeiten, Ihre Daten nicht in Trainings- und Testdatensätze aufteilen müssen.

Das ist alles enthalten

6 Videos3 Lektüren1 peer review

Dozenten

Lehrkraftbewertungen
4.3 (17 Bewertungen)
Jen Rose
Wesleyan University
4 Kurse92.516 Lernende

von

Wesleyan University

Empfohlen, wenn Sie sich für Maschinelles Lernen interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“

Bewertungen von Lernenden

4.2

323 Bewertungen

  • 5 stars

    56,65 %

  • 4 stars

    25,69 %

  • 3 stars

    7,73 %

  • 2 stars

    4,02 %

  • 1 star

    5,88 %

Zeigt 3 von 323 an

MS
4

Geprüft am 21. März 2016

MK
4

Geprüft am 26. Apr. 2020

BC
5

Geprüft am 4. Okt. 2016

Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen