La modélisation statistique est au cœur de la science des données. Des modèles statistiques bien conçus permettent aux scientifiques de tirer des conclusions sur le monde à partir des informations limitées présentes dans leurs données. Dans cette séquence de trois crédits, les apprenants ajouteront quelques techniques de modélisation statistique intermédiaires et avancées à leur boîte à outils de la science des données. En particulier, les apprenants deviendront compétents dans la théorie et l'application de l'analyse de régression linéaire, de l'ANOVA et de la conception expérimentale, ainsi que des modèles linéaires et additifs généralisés. L'accent sera mis sur l'analyse de données réelles à l'aide du langage de programmation R.
Cette spécialisation peut être suivie pour des crédits académiques dans le cadre du Master of Science in Data Science (MS-DS) de CU Boulder offert sur la plateforme Coursera. Le MS-DS est un diplôme interdisciplinaire qui réunit des professeurs des départements de mathématiques appliquées, d'informatique, de sciences de l'information et d'autres départements du CU Boulder. Avec des admissions basées sur la performance et aucun processus de candidature, le MS-DS est idéal pour les personnes ayant un large éventail d'études de premier cycle et / ou d'expérience professionnelle en informatique, en sciences de l'information, en mathématiques et en statistiques. Pour en savoir plus sur le programme MS-DS, consultez le site https://www.coursera.org/degrees/master-of-science-data-science-boulder.
Logo adapté d'une photo de Vincent Ledvina sur Unsplash
Projet d'apprentissage appliqué
Les apprenants maîtriseront l'application et la mise en œuvre de modèles statistiques par le biais de devoirs Jupyter Notebook notés automatiquement et évalués par les pairs. Dans ces travaux, les apprenants utiliseront des données du monde réel et des techniques avancées de modélisation statistique pour répondre à d'importantes questions scientifiques et commerciales.