Johns Hopkins University

Introduction au Tidyverse

Carrie Wright, PhD
Shannon Ellis, PhD
Stephanie Hicks, PhD

Instructeurs : Carrie Wright, PhD

4 522 déjà inscrits

Inclus avec Coursera Plus

Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.4

(42 avis)

niveau Débutant

Expérience recommandée

7 heures pour terminer
3 semaines à 2 heures par semaine
Planning flexible
Apprenez à votre propre rythme
Obtenez un aperçu d'un sujet et apprenez les principes fondamentaux.
4.4

(42 avis)

niveau Débutant

Expérience recommandée

7 heures pour terminer
3 semaines à 2 heures par semaine
Planning flexible
Apprenez à votre propre rythme

Ce que vous apprendrez

  • Distinguer les données ordonnées des données non ordonnées

  • Décrire comment des données non ordonnées peuvent être transformées en données ordonnées

  • Décrivez l'écosystème de paquets de Tidyverse

  • Organiser et initialiser un projet de science des données

Compétences que vous acquerrez

  • Catégorie : Gestion des données
  • Catégorie : Visualisation de Données
  • Catégorie : La programmation en R
  • Catégorie : nettoyage des données

Détails à connaître

Certificat partageable

Ajouter à votre profil LinkedIn

Évaluations

5 devoirs

Enseigné en Anglais

Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées

Emplacement réservé

Élaborez votre expertise du sujet

Ce cours fait partie de la Spécialisation Compétences Tidyverse pour la science des données en R
Lorsque vous vous inscrivez à ce cours, vous êtes également inscrit(e) à cette Spécialisation.
  • Apprenez de nouveaux concepts auprès d'experts du secteur
  • Acquérez une compréhension de base d'un sujet ou d'un outil
  • Développez des compétences professionnelles avec des projets pratiques
  • Obtenez un certificat professionnel partageable
Emplacement réservé
Emplacement réservé

Obtenez un certificat professionnel

Ajoutez cette qualification à votre profil LinkedIn ou à votre CV

Partagez-le sur les réseaux sociaux et dans votre évaluation de performance

Emplacement réservé

Il y a 6 modules dans ce cours

Avant de pouvoir discuter de toutes les façons dont R facilite le travail avec des données ordonnées, nous devons d'abord nous assurer que nous savons ce que sont des données ordonnées. Les ensembles de données ordonnées sont, par conception, plus faciles à manipuler, à modéliser et à visualiser, car les principes des données ordonnées que nous aborderons dans ce cours imposent un cadre général et un ensemble cohérent de règles aux données. En fait, une citation bien connue de Hadley Wickham est que "les ensembles de données bien rangés se ressemblent tous, mais chaque ensemble de données désordonné est désordonné à sa manière" L'utilisation d'un format de données cohérent et ordonné permet de créer des outils qui fonctionnent bien dans ce cadre, ce qui simplifie en fin de compte les processus de traitement, de visualisation et d'analyse des données. Si vous commencez avec des données qui sont déjà dans un format ordonné ou si vous prenez le temps, au début d'un projet, de mettre les données dans un format ordonné, les autres étapes de votre projet de science des données seront plus faciles.

Inclus

6 lectures2 devoirs

S'il est important de discuter de ce que sont les données ordonnées et de ce à quoi elles ressemblent, c'est parce que dans le monde, la plupart des données ne sont pas ordonnées. Si ce n'est pas vous qui saisissez les données, mais quelqu'un d'autre qui vous les remet pour réaliser un projet, le plus souvent, ces données ne seront pas ordonnées. Les données non ordonnées sont souvent appelées simplement "données désordonnées". Pour pouvoir travailler facilement avec ces données, vous devez les mettre en forme. Cela signifie que vous devez reconnaître les données désordonnées et comprendre comment les mettre en forme. Les problèmes courants suivants, observés dans les ensembles de données désordonnées, sont à nouveau tirés de l'article de Hadley Wickham sur les données ordonnées (http://vita.had.co.nz/papers/tidy-data.pdf). Après un bref rappel de chaque problème courant, nous examinerons quelques ensembles de données désordonnées. Nous aborderons enfin les concepts de rangement des données désordonnées, mais nous ne ferons pas encore d'exercices pratiques. C'est pour bientôt !

Inclus

3 lectures1 devoir

Avec une solide compréhension des données bien rangées et de la façon dont les données bien rangées s'intègrent dans le cycle de vie de la science des données, nous allons prendre un peu de temps pour vous présenter les paquets tidyverse et tidyverse-adjacent que nous allons enseigner et utiliser tout au long de cette spécialisation. L'ensemble de ces packages constitue ce que nous appelons l'écosystème tidyverse. Le but du reste de ce cours n'est pas que vous compreniez comment utiliser chacun de ces paquets (ce sera bientôt le cas !), mais plutôt de vous aider à vous familiariser avec quels paquets correspondent à quelle partie du cycle de vie de la science des données. Notez que les paquets officiels de tidyverse ci-dessous sont en gras. Tous les autres paquets sont adjacents à tidyverse, ce qui signifie qu'ils suivent les mêmes conventions que les paquets officiels de tidyverse et qu'ils fonctionnent bien dans le cadre et la structure tidy de l'analyse des données.

Inclus

5 lectures

Les projets de science des données varient considérablement et il peut donc être difficile de donner des règles universelles sur la façon dont ils devraient être organisés. Cependant, il existe quelques façons d'organiser les projets qui sont généralement utiles. En particulier, presque tous les projets doivent gérer des fichiers de différentes sortes - fichiers de données, fichiers de code, fichiers de sortie, etc. Cette section traite du fonctionnement des fichiers et de la manière dont les projets peuvent être organisés et personnalisés.

Inclus

6 lectures2 devoirs

Tout au long de cette spécialisation, nous allons utiliser un certain nombre d'études de cas provenant des Open Case Studies pour démontrer les concepts introduits dans le cours. Nous utiliserons généralement les mêmes études de cas tout au long de la spécialisation, assurant ainsi une continuité qui vous permettra de vous concentrer sur les concepts et les compétences enseignés (plutôt que sur le contexte) tout en travaillant avec des données intéressantes. Ces études de cas visent à répondre à une question de santé publique et utilisent toutes des données réelles.

Inclus

2 lectures2 laboratoires non notés

Ce projet vous permettra de créer un nouveau projet et d'organiser les fichiers nécessaires à une future analyse de données

Inclus

1 évaluation par les pairs

Instructeurs

Évaluations de l’enseignant
4.3 (15 évaluations)
Carrie Wright, PhD
Johns Hopkins University
7 Cours7 854 apprenants
Shannon Ellis, PhD
Johns Hopkins University
5 Cours6 030 apprenants
Stephanie Hicks, PhD
Johns Hopkins University
5 Cours6 030 apprenants

Offert par

Recommandé si vous êtes intéressé(e) par Analyse des Données

Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?

Felipe M.
Étudiant(e) depuis 2018
’Pouvoir suivre des cours à mon rythme à été une expérience extraordinaire. Je peux apprendre chaque fois que mon emploi du temps me le permet et en fonction de mon humeur.’
Jennifer J.
Étudiant(e) depuis 2020
’J'ai directement appliqué les concepts et les compétences que j'ai appris de mes cours à un nouveau projet passionnant au travail.’
Larry W.
Étudiant(e) depuis 2021
’Lorsque j'ai besoin de cours sur des sujets que mon université ne propose pas, Coursera est l'un des meilleurs endroits où se rendre.’
Chaitanya A.
’Apprendre, ce n'est pas seulement s'améliorer dans son travail : c'est bien plus que cela. Coursera me permet d'apprendre sans limites.’

Avis des étudiants

Affichage de 3 sur 42

4.4

42 avis

  • 5 stars

    69,76 %

  • 4 stars

    16,27 %

  • 3 stars

    4,65 %

  • 2 stars

    2,32 %

  • 1 star

    6,97 %

DI
5

Révisé le 17 avr. 2024

DM
5

Révisé le 30 oct. 2022

Emplacement réservé

Ouvrez de nouvelles portes avec Coursera Plus

Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement

Faites progresser votre carrière avec un diplôme en ligne

Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne

Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires

Améliorez les compétences de vos employés pour exceller dans l’économie numérique

Foire Aux Questions