Cette Specialization est destinée aux data scientists ayant une certaine familiarité avec le langage de programmation R et qui cherchent à faire de la science des données en utilisant la famille de packages Tidyverse. A travers 5 cours, vous couvrirez l'importation, le traitement, la visualisation et la modélisation des données en utilisant le puissant framework Tidyverse. Les packages Tidyverse fournissent une approche simple mais puissante de la science des données qui s'étend des analyses les plus basiques aux déploiements massifs de données. Ce cours couvre le cycle de vie complet d'un projet de science des données et présente des outils Tidy spécifiques pour chaque étape.
Projet d'apprentissage appliqué
Les apprenants s'engageront dans un projet à la fin de chaque cours. A travers chaque projet, les apprenants construiront et organiseront un projet de science des données à partir de zéro, importeront et manipuleront des données à partir d'une variété de formats de données, transformeront des données non ordonnées en données ordonnées, visualiseront des données avec ggplot2, et construiront des modèles de prédiction d'apprentissage automatique.