Grundlegende Konzepte in den Bereichen Wahrscheinlichkeit, Statistik und lineare Modelle sind die wichtigsten Bausteine für die datenwissenschaftliche Arbeit. Lernende, die Biostatistiker und Datenwissenschaftler werden wollen, werden von den grundlegenden Kenntnissen profitieren, die in dieser Specialization angeboten werden. Sie werden in die Lage versetzt, die Mechanismen hinter den Kulissen der wichtigsten Modellierungstools in der Datenwissenschaft, wie kleinste Quadrate und lineare Regression, zu verstehen.
Diese Spezialisierung beginnt mit Bootcamps zur mathematischen Statistik, insbesondere mit Konzepten und Methoden, die in biostatistischen Anwendungen verwendet werden. Diese reichen von Wahrscheinlichkeits-, Verteilungs- und Likelihood-Konzepten bis hin zu Hypothesentests und Fall-Kontroll-Stichproben.
Diese Spezialisierung umfasst auch lineare Modelle für die Datenwissenschaft, angefangen vom Verständnis der kleinsten Quadrate aus einer linearen algebraischen und mathematischen Perspektive bis hin zu statistischen linearen Modellen, einschließlich multivariater Regression unter Verwendung der Programmiersprache R. Diese Kurse vermitteln den Teilnehmern eine solide Grundlage in der linearen algebraischen Behandlung der Regressionsmodellierung, die das allgemeine Verständnis angewandter Datenwissenschaftler für Regressionsmodelle erheblich erweitert.
Diese Spezialisierung erfordert ein gewisses Maß an mathematischer Raffinesse. Grundkenntnisse in Kalkül und linearer Algebra sind für die Beschäftigung mit dem Inhalt erforderlich.
Praktisches Lernprojekt
Die Advanced Statistics for Data Science Specializations beinhaltet eine Reihe von strengen, benoteten Tests, um das Verständnis von Schlüsselkonzepten wie Wahrscheinlichkeit, Verteilung und Wahrscheinlichkeitskonzepte für Hypothesentests und Fall-Kontroll-Stichproben zu prüfen.