Am Ende dieses ersten Kurses im Rahmen der Total Data Quality Specialization werden die Teilnehmer in der Lage sein:
1. Die wesentlichen Unterschiede zwischen entworfenen und gesammelten Daten zu identifizieren und die Schlüsseldimensionen des Total Data Quality (TDQ) Framework zusammenzufassen; 2. Die drei Messdimensionen des Total Data Quality Frameworks zu definieren und potenzielle Gefahren für die Datenqualität entlang jeder dieser Dimensionen sowohl für erfasste als auch für entworfene Daten zu beschreiben; 3. Definieren Sie die drei Darstellungsdimensionen des Total Data Quality Frameworks und beschreiben Sie potenzielle Gefahren für die Datenqualität entlang jeder dieser Dimensionen, sowohl für gesammelte als auch für entworfene Daten; und 4. Beschreiben Sie, warum die Datenanalyse eine wichtige Dimension des Rahmenwerks für totale Datenqualität definiert, und fassen Sie potenzielle Gefahren für die Gesamtqualität eines Analyseplans für entworfene und/oder gesammelte Daten zusammen. Die gesamte Specialization zielt darauf ab, das Rahmenwerk für totale Datenqualität zu vertiefen und den Lernenden mehr Informationen über die detaillierte Bewertung der totalen Datenqualität zu geben, die vor der Datenanalyse erfolgen muss. Ziel ist es, dass die Lernenden die Bewertung der Datenqualität als kritische Komponente für alle Projekte in ihren Prozess integrieren. Wir hoffen aufrichtig, das Wissen über die gesamte Datenqualität an alle Lernenden, wie z.B. Datenwissenschaftler und quantitative Analysten, weiterzugeben, die in den ersten Schritten des datenwissenschaftlichen Prozesses, die sich auf die Datenerfassung und die Bewertung der Datenqualität konzentrieren, nicht ausreichend geschult wurden. Wir sind der Meinung, dass ein umfangreiches Wissen über datenwissenschaftliche Techniken und statistische Analyseverfahren einer quantitativen Forschungsstudie nicht weiterhilft, wenn die gesammelten Daten nicht von ausreichend hoher Qualität sind. Diese Specializations konzentrieren sich auf die wesentlichen ersten Schritte bei jeder Art von wissenschaftlicher Untersuchung, bei der Daten verwendet werden: entweder die Generierung oder die Sammlung von Daten, das Verständnis dafür, woher die Daten stammen, die Bewertung der Datenqualität und die Ergreifung von Maßnahmen zur Maximierung der Datenqualität, bevor irgendeine Art von statistischer Analyse durchgeführt oder datenwissenschaftliche Techniken zur Beantwortung von Forschungsfragen angewendet werden. Angesichts dieses Schwerpunkts wird es nur wenig Material über die Analyse von Daten geben, die in unzähligen bestehenden Coursera Specializations behandelt wird. Das Hauptaugenmerk dieser Specialization liegt auf dem Verständnis und der Maximierung der Datenqualität vor der Analyse.