À la fin de ce premier cours de la spécialisation Qualité totale des données, les apprenants seront en mesure de :
1. Identifier les différences essentielles entre les données conçues et les données collectées et résumer les dimensions clés du cadre de la qualité totale des données (QTD) ; 2. Définir les trois dimensions de mesure du cadre de la qualité totale des données et décrire les menaces potentielles à la qualité des données selon chacune de ces dimensions pour les données collectées et conçues ; 3. Définir les trois dimensions de représentation du cadre de qualité totale des données et décrire les menaces potentielles à la qualité des données pour chacune de ces dimensions, tant pour les données collectées que pour les données conçues ; et 4. Décrire pourquoi l'analyse des données définit une dimension importante du cadre de qualité totale des données et résumer les menaces potentielles à la qualité globale d'un plan d'analyse pour les données conçues et/ou collectées. Cette spécialisation dans son ensemble vise à explorer en profondeur le cadre de qualité totale des données et à fournir aux apprenants plus d'informations sur l'évaluation détaillée de la qualité totale des données qui doit avoir lieu avant l'analyse des données. L'objectif est que les apprenants intègrent l'évaluation de la qualité des données dans leur processus en tant que composante essentielle de tous les projets. Nous espérons sincèrement diffuser les connaissances sur la qualité totale des données à tous les apprenants, tels que les scientifiques des données et les analystes quantitatifs, qui n'ont pas reçu une formation suffisante dans les étapes initiales du processus de la science des données qui se concentrent sur la collecte des données et l'évaluation de la qualité des données. Nous pensons qu'une connaissance approfondie des techniques de la science des données et des procédures d'analyse statistique n'aidera pas une étude de recherche quantitative si les données collectées ne sont pas d'une qualité suffisante. Cette spécialisation se concentrera sur les premières étapes essentielles de tout type d'investigation scientifique utilisant des données : générer ou collecter des données, comprendre d'où viennent les données, évaluer la qualité des données et prendre des mesures pour maximiser la qualité des données avant d'effectuer tout type d'analyse statistique ou d'appliquer des techniques de la science des données pour répondre à des questions de recherche. Compte tenu de cette orientation, il y aura peu de matériel sur l'analyse des données, qui est couvert dans une myriade de spécialisations Coursera existantes. L'objectif principal de cette spécialisation sera de comprendre et de maximiser la qualité des données avant l'analyse.