Les concepts fondamentaux en matière de probabilités, de statistiques et de modèles linéaires sont des éléments de base pour le travail en science des données. Les apprenants qui aspirent à devenir des biostatisticiens et des scientifiques de données bénéficieront des connaissances fondamentales offertes dans cette spécialisation. Elle permettra à l'apprenant de comprendre les mécanismes cachés des principaux outils de modélisation en science des données, tels que les moindres carrés et la régression linéaire.
Cette spécialisation commence avec les bootcamps de statistiques mathématiques, en particulier les concepts et les méthodes utilisés dans les applications de biostatistique. Cela va des concepts de probabilité, de distribution et de vraisemblance aux tests d'hypothèse et à l'échantillonnage cas-témoins.
Cette spécialisation comprend également des modèles linéaires pour la science des données, allant de la compréhension des moindres carrés d'un point de vue algébrique linéaire et mathématique, aux modèles linéaires statistiques, y compris la régression multivariée à l'aide du langage de programmation R. Ces cours donneront aux apprenants une base solide dans le traitement algébrique linéaire de la modélisation de la régression, ce qui augmentera considérablement la compréhension générale des modèles de régression par les scientifiques des données appliquées.
Cette spécialisation requiert un certain niveau de sophistication mathématique. Des notions élémentaires de calcul et d'algèbre linéaire sont nécessaires pour s'engager dans le contenu.
Projet d'apprentissage appliqué
La spécialisation Advanced Statistics for Data Science intègre une série de quiz notés rigoureux pour tester la compréhension de concepts clés tels que les concepts de probabilité, de distribution et de vraisemblance aux tests d'hypothèse et à l'échantillonnage cas-témoins.