Die statistische Modellierung ist das Herzstück der Datenwissenschaft. Gut ausgearbeitete statistische Modelle ermöglichen es Datenwissenschaftlern, aus den begrenzten Informationen in ihren Daten Rückschlüsse auf die Welt zu ziehen. In dieser dreiteiligen Kursreihe werden die Teilnehmer ihr Data-Science-Toolkit um einige mittlere und fortgeschrittene statistische Modellierungstechniken erweitern. Insbesondere werden die Teilnehmer mit der Theorie und Anwendung der linearen Regressionsanalyse, der ANOVA und der Versuchsplanung sowie mit verallgemeinerten linearen und additiven Modellen vertraut gemacht. Der Schwerpunkt liegt auf der Analyse realer Daten unter Verwendung der Programmiersprache R.
Diese Spezialisierung kann im Rahmen des Master of Science in Data Science (MS-DS) der CU Boulder, der auf der Coursera-Plattform angeboten wird, als akademische Leistung angerechnet werden. Der MS-DS ist ein interdisziplinärer Studiengang, der Lehrkräfte aus den Fachbereichen Angewandte Mathematik, Informatik, Informationswissenschaften und anderen Bereichen der CU Boulder zusammenbringt. Da die Zulassung leistungsabhängig ist und es kein Bewerbungsverfahren gibt, ist der MS-DS ideal für Personen mit einem breiten Spektrum an grundständiger Ausbildung und/oder Berufserfahrung in Informatik, Informationswissenschaft, Mathematik und Statistik. Erfahren Sie mehr über das MS-DS-Programm unter https://www.coursera.org/degrees/master-of-science-data-science-boulder.
Logo angepasst nach einem Foto von Vincent Ledvina auf Unsplash
Praktisches Lernprojekt
Die Lernenden beherrschen die Anwendung und Implementierung statistischer Modelle anhand von automatisch bewerteten und von Experten begutachteten Jupyter Notebook-Aufgaben. Bei diesen Aufgaben werden die Lernenden reale Daten und fortgeschrittene statistische Modellierungstechniken verwenden, um wichtige wissenschaftliche und geschäftliche Fragen zu beantworten.