Johns Hopkins University
Modélisation des données dans le Tidyverse
Johns Hopkins University

Modélisation des données dans le Tidyverse

Ce cours fait partie de Spécialisation Compétences Tidyverse pour la science des données en R

Enseigné en Anglais

Certains éléments de contenu peuvent ne pas être traduits

Carrie Wright, PhD
Shannon Ellis, PhD
Stephanie Hicks, PhD

Instructeurs : Carrie Wright, PhD

Inclus avec Coursera Plus

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

21 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Décrire les différents types de questions d'analyse de données

  • Effectuer des tests d'hypothèse sur vos données

  • Appliquer des techniques de modélisation linéaire pour répondre à des questions multivariables

  • Appliquer des flux de travail d'apprentissage automatique pour détecter des modèles complexes dans vos données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

8 quizzes

Cours

Familiarisez-vous avec un sujet et apprenez les fondamentaux

21 heures (approximativement)
Planning flexible
Apprenez à votre propre rythme

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Placeholder

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Compétences Tidyverse pour la science des données en R
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Placeholder
Placeholder

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Placeholder

Il y a 11 modules dans ce cours

Le développement d'informations sur votre organisation, votre entreprise ou votre projet de recherche dépend d'une modélisation et d'une analyse efficaces des données que vous collectez. Pour construire des modèles efficaces, il faut comprendre les différents types de questions que vous pouvez poser et la manière de les faire correspondre à vos données. Différentes approches de modélisation peuvent être choisies pour détecter des modèles intéressants dans les données et identifier des relations cachées.

Inclus

16 lectures1 quiz

L'analyse inférentielle est ce que les analystes effectuent après avoir décrit et exploré leur ensemble de données. Après avoir mieux compris votre ensemble de données, les analystes tentent souvent de déduire quelque chose des données. Pour ce faire, ils utilisent des tests statistiques. Nous avons discuté de la manière dont nous pouvons utiliser des modèles pour effectuer des analyses d'inférence et de prédiction. Qu'est-ce que cela signifie ?

Inclus

3 lectures1 quiz

Les modèles linéaires sont les modèles les plus couramment utilisés dans l'analyse des données en raison de leur efficacité informatique et de leur facilité d'interprétation. Une bonne compréhension des modèles linéaires et de leur fonctionnement est essentielle pour tout travail dans le domaine de la science des données. Le tidyverse fournit un ensemble d'outils permettant de rendre la modélisation linéaire plus efficace et plus rationnelle.

Inclus

12 lectures1 quiz

La régression linéaire multiple est nécessaire lorsque vous souhaitez inclure des facteurs de confusion ou d'autres prédicteurs dans votre modèle de réponse. R fournit un moyen simple de le faire via l'interface de formule de la fonction lm().

Inclus

1 lecture1 quiz

Bien que nous nous soyons concentrés sur la régression linéaire dans cette leçon sur l'inférence, la régression linéaire n'est pas la seule approche analytique existante. Cependant, on peut dire que c'est la plus couramment utilisée. En outre, il existe de nombreux tests et approches statistiques qui sont de légères variations de la régression linéaire, de sorte qu'une base solide et une bonne compréhension de la régression linéaire simplifient grandement la compréhension de ces autres tests et approches. Par exemple, que se passerait-il si vous ne vouliez pas mesurer la relation linéaire entre deux variables, mais plutôt savoir si la moyenne observée est différente de l'espérance ?

Inclus

3 lectures

Les tests d'hypothèse décrivent une famille de techniques statistiques permettant de déterminer si les données collectées fournissent des preuves de la valeur d'un paramètre inconnu d'intérêt. L'objectif des tests d'hypothèses est de faire des déductions tout en tenant compte de la variabilité des données qui peut conduire à des résultats erronés.

Inclus

3 lectures1 quiz1 plugin

La modélisation de la prédiction est une activité essentielle de la science des données et implique la construction de systèmes permettant de faire des prédictions basées sur des données observées précédemment. Ces modèles sont généralement très flexibles et peuvent saisir un éventail de relations différentes.

Inclus

12 lectures1 quiz

Grâce au travail de RStudio, des packages incroyablement utiles sont disponibles dans R. Comme indiqué plus haut, il existe des centaines d'algorithmes d'apprentissage automatique différents. Les paquets R tidymodels ont rassemblé un grand nombre d'entre eux dans un cadre unique, ce qui vous permet d'utiliser facilement de nombreux modèles d'apprentissage automatique différents.

Inclus

5 lectures1 quiz

Cette étude de cas présente une approche de la construction d'un modèle de prévision des concentrations de pollution de l'air extérieur aux États-Unis.

Inclus

17 lectures1 laboratoire non noté

La collection de paquets tidymodels peut être écrasante à première vue. Nous vous proposons ici un tableau récapitulatif rapide pour vous aider à vous y retrouver parmi tous les paquets et à savoir quand ils doivent être utilisés.

Inclus

1 lecture

Dans ce projet, vous vous entraînerez à construire des modèles avec le tidyverse pour classer les données des plaintes des consommateurs provenant du Consumer Financial Protection Bureau (CFPB). Ce projet comprend à la fois une étape d'évaluation par les pairs au cours de laquelle vous téléchargerez des fichiers R Markdown et HTML tricotés ET une étape de quiz au cours de laquelle vous répondrez à des questions sur les prédictions faites par votre algorithme de classification.

Inclus

1 lecture1 quiz1 évaluation par les pairs

Instructeurs

Carrie Wright, PhD
Johns Hopkins University
7 Cours7 704 apprenants
Shannon Ellis, PhD
Johns Hopkins University
5 Cours5 941 apprenants
Stephanie Hicks, PhD
Johns Hopkins University
5 Cours5 941 apprenants

Offert par

Recommandé si vous êtes intéressé(e) par Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’
Placeholder

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions