L'introduction des données dans votre système d'analyse statistique peut être l'une des parties les plus difficiles de tout projet de science des données. Les données doivent être importées et harmonisées dans un format cohérent avant de pouvoir obtenir des informations. Vous apprendrez à importer des données dans R à partir de formats couramment utilisés et à harmoniser différents types d'ensembles de données provenant de différentes sources. Si vous travaillez dans une organisation où différents départements collectent des données en utilisant différents systèmes et différents formats de stockage, ce cours vous fournira des outils essentiels pour rassembler ces ensembles de données et donner un sens à la richesse de l'information dans votre organisation. Ce cours présente les outils Tidyverse pour importer des données dans R afin qu'elles puissent être préparées pour l'analyse, la visualisation et la modélisation. Les formats de données courants sont présentés, y compris les fichiers délimités, les feuilles de calcul et les bases de données relationnelles, et des techniques pour obtenir des données à partir du Web sont démontrées, telles que le web scraping et les API Web. Dans cette spécialisation, nous supposons que vous êtes familier avec le langage de programmation R. Si vous n'êtes pas encore familiarisé avec R, nous vous suggérons de suivre d'abord le cours de programmation R avant de suivre ce cours.
Offrez à votre carrière le cadeau de Coursera Plus avec $160 de réduction, facturé annuellement. Économisez aujourd’hui.
Importer des données dans Tidyverse
Ce cours fait partie de Spécialisation Compétences Tidyverse pour la science des données en R
Instructeurs : Carrie Wright, PhD
1 886 déjà inscrits
Inclus avec
(44 avis)
Expérience recommandée
Ce que vous apprendrez
Décrire les différents formats de données
Appliquer les fonctions de Tidyverse pour importer des données dans R à partir de formats externes
Obtenir des données à partir d'une API web
Détails à connaître
Ajouter à votre profil LinkedIn
5 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 6 modules dans ce cours
Le tibble est un type de données de base dans le monde de Tidy. Les tibbles stockent des données tabulaires et sont une version moderne du cadre de données R standard. Ils possèdent de nombreuses fonctionnalités conviviales qui constituent une amélioration par rapport aux cadres de données standard lorsque vous effectuez des analyses de données interactives. Le reste de ce module couvre les données tabulaires dans des formats de feuilles de calcul comme Excel, CSV, TSV et d'autres fichiers délimités.
Inclus
15 lectures1 devoir
Les données peuvent se présenter sous des formats non tabulaires, en particulier les données non structurées ou les données qui n'entreraient pas dans un tableau. JSON et XML sont des formats courants pour le stockage de données arbitrairement structurées et ce module couvre les packages utilisés pour lire ces formats de données. En outre, les bases de données relationnelles sont couramment utilisées pour stocker de très grandes collections de tableaux lorsque vous n'avez pas besoin de lire l'ensemble des données en une seule fois. Il existe de nombreux formats de bases de données relationnelles et nous couvrirons le format SQLite, qui est un format compact et simple à utiliser.
Inclus
10 lectures1 devoir
La lecture de données provenant de diverses sources Internet peut s'avérer utile pour élaborer des analyses qui doivent être régulièrement mises à jour. Les paquets rvest et httr sont utiles pour se connecter à des sites web, à des API web et à d'autres sources de données en ligne.
Inclus
11 lectures1 devoir
Travailler avec d'autres personnes dans le cadre d'un projet de science des données implique souvent de lire des résultats ou des données produits à l'aide d'autres progiciels d'analyse statistique ou d'autres logiciels. Ce module couvre les logiciels permettant de lire ces formats étrangers, ainsi que les images et les données provenant de Google Drive.
Inclus
3 lectures1 devoir
Nous allons maintenant vous montrer comment importer des données à l'aide de nos exemples d'études de cas. Lorsque vous travaillez sur les étapes des études de cas, vous pouvez utiliser soit RStudio sur votre propre ordinateur, soit les espaces de laboratoire Coursera fournis pour chaque étude de cas.
Inclus
11 lectures2 laboratoires non notés
Ce projet vous donnera l'occasion de lire des données provenant de plusieurs sources et d'effectuer quelques opérations simples sur ces données.
Inclus
2 lectures1 devoir
Instructeurs
Offert par
Recommandé si vous êtes intéressé(e) par Analyse des Données
Duke University
Johns Hopkins University
Johns Hopkins University
Johns Hopkins University
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Avis des étudiants
Affichage de 3 sur 44
44 avis
- 5 stars
75,55 %
- 4 stars
20 %
- 3 stars
4,44 %
- 2 stars
0 %
- 1 star
0 %
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à plus de 7 000 cours de renommée internationale, à des projets pratiques et à des programmes de certificats reconnus sur le marché du travail, tous inclus dans votre abonnement
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
L'accès aux cours et aux devoirs dépend de votre type d'inscription. Si vous suivez un cours en mode audit, vous pourrez consulter gratuitement la plupart des supports de cours. Pour accéder aux devoirs notés et obtenir un certificat, vous devrez acheter l'expérience de certificat, pendant ou après votre audit. Si vous ne voyez pas l'option d'audit :
Il se peut que le cours ne propose pas d'option d'audit. Vous pouvez essayer un essai gratuit ou demander une aide financière.
Le cours peut proposer l'option "Cours complet, pas de certificat" à la place. Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la Specializations, et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez uniquement lire et visualiser le contenu du cours, vous pouvez auditer le cours gratuitement.
Si vous vous êtes abonné, vous bénéficiez d'une période d'essai gratuite de 7 jours pendant laquelle vous pouvez annuler votre abonnement sans pénalité. Après cette période, nous ne remboursons pas, mais vous pouvez résilier votre abonnement à tout moment. Consultez notre politique de remboursement complète.