Johns Hopkins University
Modellierung von Daten im Tidyverse
Johns Hopkins University

Modellierung von Daten im Tidyverse

Carrie Wright, PhD
Shannon Ellis, PhD
Stephanie Hicks, PhD

Dozenten: Carrie Wright, PhD

Bei Coursera Plus enthalten

Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Es dauert 21 Stunden
3 Wochen bei 7 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen
Verschaffen Sie sich einen Einblick in ein Thema und lernen Sie die Grundlagen.
Es dauert 21 Stunden
3 Wochen bei 7 Stunden pro Woche
Flexibler Zeitplan
In Ihrem eigenen Lerntempo lernen

Was Sie lernen werden

  • Beschreiben Sie verschiedene Arten von Fragen zur Datenanalyse

  • Führen Sie Hypothesentests für Ihre Daten durch

  • Anwendung linearer Modellierungstechniken zur Beantwortung multivariabler Fragen

  • Wenden Sie Workflows für maschinelles Lernen an, um komplexe Muster in Ihren Daten zu erkennen

Wichtige Details

Zertifikat zur Vorlage

Zu Ihrem LinkedIn-Profil hinzufügen

Bewertungen

8 Aufgaben

Unterrichtet in Englisch

Erfahren Sie, wie Mitarbeiter führender Unternehmen gefragte Kompetenzen erwerben.

Platzhalter

Erweitern Sie Ihre Fachkenntnisse

Dieser Kurs ist Teil der Spezialisierung Spezialisierung Tidyverse-Fähigkeiten für Datenwissenschaft in R
Wenn Sie sich für diesen Kurs anmelden, werden Sie auch für diese Spezialisierung angemeldet.
  • Lernen Sie neue Konzepte von Branchenexperten
  • Gewinnen Sie ein Grundverständnis bestimmter Themen oder Tools
  • Erwerben Sie berufsrelevante Kompetenzen durch praktische Projekte
  • Erwerben Sie ein Berufszertifikat zur Vorlage
Platzhalter
Platzhalter

Erwerben Sie ein Karrierezertifikat.

Fügen Sie diese Qualifikation zur Ihrem LinkedIn-Profil oder Ihrem Lebenslauf hinzu.

Teilen Sie es in den sozialen Medien und in Ihrer Leistungsbeurteilung.

Platzhalter

In diesem Kurs gibt es 11 Module

Die Entwicklung von Erkenntnissen über Ihre Organisation, Ihr Unternehmen oder Ihr Forschungsprojekt hängt von einer effektiven Modellierung und Analyse der von Ihnen gesammelten Daten ab. Um effektive Modelle zu erstellen, müssen Sie die verschiedenen Arten von Fragen verstehen, die Sie stellen können, und wissen, wie Sie diese Fragen auf Ihre Daten übertragen können. Es können verschiedene Modellierungsansätze gewählt werden, um interessante Muster in den Daten zu erkennen und verborgene Beziehungen zu identifizieren.

Das ist alles enthalten

16 Lektüren1 Aufgabe

Die inferenzielle Analyse ist das, was Analysten durchführen, nachdem sie ihren Datensatz beschrieben und erforscht haben. Nachdem Sie Ihren Datensatz besser verstanden haben, versuchen Analysten oft, etwas aus den Daten abzuleiten. Dies geschieht mit Hilfe statistischer Tests. Wir haben ein wenig darüber gesprochen, wie wir Modelle verwenden können, um Inferenz- und Vorhersageanalysen durchzuführen. Was ist damit gemeint?

Das ist alles enthalten

3 Lektüren1 Aufgabe

Lineare Modelle sind die am häufigsten verwendeten Modelle in der Datenanalyse, da sie rechnerisch effizient und einfach zu interpretieren sind. Ein solides Verständnis der linearen Modelle und ihrer Funktionsweise ist für jede Arbeit in der Datenwissenschaft von entscheidender Bedeutung. Tidyverse bietet eine Reihe von Tools, mit denen die lineare Modellierung effizienter und schlanker wird.

Das ist alles enthalten

12 Lektüren1 Aufgabe

Eine multiple lineare Regression wird benötigt, wenn Sie Störfaktoren oder andere Prädiktoren in Ihr Modell für die Antwort einbeziehen möchten. R bietet eine unkomplizierte Möglichkeit, dies über die Formelschnittstelle der Funktion lm() zu tun.

Das ist alles enthalten

1 Lektüre1 Aufgabe

Obwohl wir uns in dieser Lektion über Schlussfolgerungen auf die lineare Regression konzentriert haben, ist die lineare Regression nicht der einzige analytische Ansatz, den es gibt. Aber sie ist wohl die am häufigsten verwendete. Darüber hinaus gibt es viele statistische Tests und Ansätze, die leichte Variationen der linearen Regression sind. Wenn Sie also eine solide Grundlage und ein gutes Verständnis der linearen Regression haben, wird das Verständnis dieser anderen Tests und Ansätze viel einfacher. Was wäre zum Beispiel, wenn Sie nicht die lineare Beziehung zwischen zwei Variablen messen wollten, sondern stattdessen wissen wollten, ob der beobachtete Durchschnitt von der Erwartung abweicht oder nicht?

Das ist alles enthalten

3 Lektüren

Hypothesentests beschreiben eine Familie von statistischen Techniken, mit denen Sie feststellen können, ob die von Ihnen gesammelten Daten einen Hinweis auf den Wert eines unbekannten Parameters von Interesse liefern. Das Ziel von Hypothesentests ist es, Schlussfolgerungen zu ziehen und dabei die Variabilität der Daten zu berücksichtigen, die zu falschen Ergebnissen führen kann.

Das ist alles enthalten

3 Lektüren1 Aufgabe1 Plug-in

Die Modellierung von Vorhersagen ist eine wesentliche Aktivität in der Datenwissenschaft und beinhaltet den Aufbau von Systemen zur Erstellung von Vorhersagen auf der Grundlage von zuvor beobachteten Daten. Diese Modelle sind in der Regel sehr flexibel und können eine Reihe von unterschiedlichen Beziehungen erfassen.

Das ist alles enthalten

12 Lektüren1 Aufgabe

Dank der Arbeit von RStudio gibt es unglaublich hilfreiche Pakete in R. Wie bereits erwähnt, gibt es Hunderte von verschiedenen Algorithmen für maschinelles Lernen. Die R-Pakete von tidymodels haben viele davon in einem einzigen Framework zusammengefasst, so dass Sie viele verschiedene Modelle des maschinellen Lernens problemlos verwenden können.

Das ist alles enthalten

5 Lektüren1 Aufgabe

In dieser Fallstudie wird ein Ansatz zur Erstellung eines Prognosemodells für die Vorhersage der Luftverschmutzung in den Vereinigten Staaten vorgestellt.

Das ist alles enthalten

17 Lektüren1 Unbewertetes Labor

Die tidymodels Sammlung von Paketen kann auf den ersten Blick überwältigend sein. Hier finden Sie eine kurze Übersichtstabelle, die Ihnen hilft, alle Pakete zu finden und herauszufinden, wann sie verwendet werden sollten.

Das ist alles enthalten

1 Lektüre

In diesem Projekt üben Sie die Erstellung von Modellen mit tidyverse zur Klassifizierung von Verbraucherbeschwerdedaten des Consumer Financial Protection Bureau (CFPB). Dieses Projekt umfasst sowohl einen Peer-Review-Schritt, bei dem Sie R Markdown- und gestrickte HTML-Dateien hochladen, als auch einen Quiz-Schritt, bei dem Sie Fragen zu den Vorhersagen Ihres Klassifizierungsalgorithmus beantworten müssen.

Das ist alles enthalten

1 Lektüre1 Aufgabe1 peer review

Dozenten

Carrie Wright, PhD
Johns Hopkins University
7 Kurse7.992 Lernende
Shannon Ellis, PhD
Johns Hopkins University
5 Kurse6.108 Lernende
Stephanie Hicks, PhD
Johns Hopkins University
5 Kurse6.108 Lernende

von

Empfohlen, wenn Sie sich für Datenanalyse interessieren

Warum entscheiden sich Menschen für Coursera für ihre Karriere?

Felipe M.
Lernender seit 2018
„Es ist eine großartige Erfahrung, in meinem eigenen Tempo zu lernen. Ich kann lernen, wenn ich Zeit und Nerven dazu habe.“
Jennifer J.
Lernender seit 2020
„Bei einem spannenden neuen Projekt konnte ich die neuen Kenntnisse und Kompetenzen aus den Kursen direkt bei der Arbeit anwenden.“
Larry W.
Lernender seit 2021
„Wenn mir Kurse zu Themen fehlen, die meine Universität nicht anbietet, ist Coursera mit die beste Alternative.“
Chaitanya A.
„Man lernt nicht nur, um bei der Arbeit besser zu werden. Es geht noch um viel mehr. Bei Coursera kann ich ohne Grenzen lernen.“
Platzhalter

Neue Karrieremöglichkeiten mit Coursera Plus

Unbegrenzter Zugang zu 10,000+ Weltklasse-Kursen, praktischen Projekten und berufsqualifizierenden Zertifikatsprogrammen - alles in Ihrem Abonnement enthalten

Bringen Sie Ihre Karriere mit einem Online-Abschluss voran.

Erwerben Sie einen Abschluss von erstklassigen Universitäten – 100 % online

Schließen Sie sich mehr als 3.400 Unternehmen in aller Welt an, die sich für Coursera for Business entschieden haben.

Schulen Sie Ihre Mitarbeiter*innen, um sich in der digitalen Wirtschaft zu behaupten.

Häufig gestellte Fragen