Le développement d'informations sur votre organisation, votre entreprise ou votre projet de recherche dépend d'une modélisation et d'une analyse efficaces des données que vous collectez. Pour construire des modèles efficaces, il faut comprendre les différents types de questions que vous pouvez poser et la manière de faire correspondre ces questions à vos données. Différentes approches de modélisation peuvent être choisies pour détecter des modèles intéressants dans les données et identifier des relations cachées. Ce cours couvre les types de questions que vous pouvez poser sur les données et les différentes approches de modélisation que vous pouvez appliquer. Les sujets abordés comprennent les tests d'hypothèse, la régression linéaire, la modélisation non linéaire et l'apprentissage automatique. Avec cette collection d'outils à votre disposition, ainsi que les techniques apprises dans les autres cours de cette spécialisation, vous serez en mesure de faire des découvertes clés à partir de vos données pour améliorer la prise de décision dans l'ensemble de votre organisation. Dans cette spécialisation, nous supposons que vous êtes familier avec le langage de programmation R. Si vous n'êtes pas encore familiarisé avec R, nous vous suggérons de suivre d'abord le cours de programmation R avant de suivre ce cours.
Modélisation des données dans le Tidyverse
Ce cours fait partie de Spécialisation Compétences Tidyverse pour la science des données en R
Instructeurs : Carrie Wright, PhD
Inclus avec
Ce que vous apprendrez
Décrire les différents types de questions d'analyse de données
Effectuer des tests d'hypothèse sur vos données
Appliquer des techniques de modélisation linéaire pour répondre à des questions multivariables
Appliquer des flux de travail d'apprentissage automatique pour détecter des modèles complexes dans vos données
Détails à connaître
Ajouter à votre profil LinkedIn
8 devoirs
Découvrez comment les employés des entreprises prestigieuses maîtrisent des compétences recherchées
Élaborez votre expertise du sujet
- Apprenez de nouveaux concepts auprès d'experts du secteur
- Acquérez une compréhension de base d'un sujet ou d'un outil
- Développez des compétences professionnelles avec des projets pratiques
- Obtenez un certificat professionnel partageable
Obtenez un certificat professionnel
Ajoutez cette qualification à votre profil LinkedIn ou à votre CV
Partagez-le sur les réseaux sociaux et dans votre évaluation de performance
Il y a 11 modules dans ce cours
Le développement d'informations sur votre organisation, votre entreprise ou votre projet de recherche dépend d'une modélisation et d'une analyse efficaces des données que vous collectez. Pour construire des modèles efficaces, il faut comprendre les différents types de questions que vous pouvez poser et la manière de les faire correspondre à vos données. Différentes approches de modélisation peuvent être choisies pour détecter des modèles intéressants dans les données et identifier des relations cachées.
Inclus
16 lectures1 devoir
L'analyse inférentielle est ce que les analystes effectuent après avoir décrit et exploré leur ensemble de données. Après avoir mieux compris votre ensemble de données, les analystes tentent souvent de déduire quelque chose des données. Pour ce faire, ils utilisent des tests statistiques. Nous avons discuté de la manière dont nous pouvons utiliser des modèles pour effectuer des analyses d'inférence et de prédiction. Qu'est-ce que cela signifie ?
Inclus
3 lectures1 devoir
Les modèles linéaires sont les modèles les plus couramment utilisés dans l'analyse des données en raison de leur efficacité informatique et de leur facilité d'interprétation. Une bonne compréhension des modèles linéaires et de leur fonctionnement est essentielle pour tout travail dans le domaine de la science des données. Le tidyverse fournit un ensemble d'outils permettant de rendre la modélisation linéaire plus efficace et plus rationnelle.
Inclus
12 lectures1 devoir
La régression linéaire multiple est nécessaire lorsque vous souhaitez inclure des facteurs de confusion ou d'autres prédicteurs dans votre modèle de réponse. R fournit un moyen simple de le faire via l'interface de formule de la fonction lm().
Inclus
1 lecture1 devoir
Bien que nous nous soyons concentrés sur la régression linéaire dans cette leçon sur l'inférence, la régression linéaire n'est pas la seule approche analytique existante. Cependant, on peut dire que c'est la plus couramment utilisée. En outre, il existe de nombreux tests et approches statistiques qui sont de légères variations de la régression linéaire, de sorte qu'une base solide et une bonne compréhension de la régression linéaire simplifient grandement la compréhension de ces autres tests et approches. Par exemple, que se passerait-il si vous ne vouliez pas mesurer la relation linéaire entre deux variables, mais plutôt savoir si la moyenne observée est différente de l'espérance ?
Inclus
3 lectures
Les tests d'hypothèse décrivent une famille de techniques statistiques permettant de déterminer si les données collectées fournissent des preuves de la valeur d'un paramètre inconnu d'intérêt. L'objectif des tests d'hypothèses est de faire des déductions tout en tenant compte de la variabilité des données qui peut conduire à des résultats erronés.
Inclus
3 lectures1 devoir1 plugin
La modélisation de la prédiction est une activité essentielle de la science des données et implique la construction de systèmes permettant de faire des prédictions basées sur des données observées précédemment. Ces modèles sont généralement très flexibles et peuvent saisir un éventail de relations différentes.
Inclus
12 lectures1 devoir
Grâce au travail de RStudio, des packages incroyablement utiles sont disponibles dans R. Comme indiqué plus haut, il existe des centaines d'algorithmes d'apprentissage automatique différents. Les paquets R tidymodels ont rassemblé un grand nombre d'entre eux dans un cadre unique, ce qui vous permet d'utiliser facilement de nombreux modèles d'apprentissage automatique différents.
Inclus
5 lectures1 devoir
Cette étude de cas présente une approche de la construction d'un modèle de prévision des concentrations de pollution de l'air extérieur aux États-Unis.
Inclus
17 lectures1 laboratoire non noté
La collection de paquets tidymodels peut être écrasante à première vue. Nous vous proposons ici un tableau récapitulatif rapide pour vous aider à vous y retrouver parmi tous les paquets et à savoir quand ils doivent être utilisés.
Inclus
1 lecture
Dans ce projet, vous vous entraînerez à construire des modèles avec le tidyverse pour classer les données des plaintes des consommateurs provenant du Consumer Financial Protection Bureau (CFPB). Ce projet comprend à la fois une étape d'évaluation par les pairs au cours de laquelle vous téléchargerez des fichiers R Markdown et HTML tricotés ET une étape de quiz au cours de laquelle vous répondrez à des questions sur les prédictions faites par votre algorithme de classification.
Inclus
1 lecture1 devoir1 évaluation par les pairs
Instructeurs
Offert par
Recommandé si vous êtes intéressé(e) par Analyse des Données
Johns Hopkins University
ESSEC Business School
University of Colorado Boulder
Pour quelles raisons les étudiants sur Coursera nous choisissent-ils pour leur carrière ?
Ouvrez de nouvelles portes avec Coursera Plus
Accès illimité à 10,000+ cours de niveau international, projets pratiques et programmes de certification prêts à l'emploi - tous inclus dans votre abonnement.
Faites progresser votre carrière avec un diplôme en ligne
Obtenez un diplôme auprès d’universités de renommée mondiale - 100 % en ligne
Rejoignez plus de 3 400 entreprises mondiales qui ont choisi Coursera pour les affaires
Améliorez les compétences de vos employés pour exceller dans l’économie numérique
Foire Aux Questions
L'accès aux cours et aux devoirs dépend de votre type d'inscription. Si vous suivez un cours en mode audit, vous pourrez consulter gratuitement la plupart des supports de cours. Pour accéder aux devoirs notés et obtenir un certificat, vous devrez acheter l'expérience de certificat, pendant ou après votre audit. Si vous ne voyez pas l'option d'audit :
Il se peut que le cours ne propose pas d'option d'audit. Vous pouvez essayer un essai gratuit ou demander une aide financière.
Le cours peut proposer l'option "Cours complet, pas de certificat" à la place. Cette option vous permet de consulter tous les supports de cours, de soumettre les évaluations requises et d'obtenir une note finale. Cela signifie également que vous ne pourrez pas acheter un certificat d'expérience.
Lorsque vous vous inscrivez au cours, vous avez accès à tous les cours de la Specializations, et vous obtenez un certificat lorsque vous terminez le travail. Votre certificat électronique sera ajouté à votre page de réalisations - de là, vous pouvez imprimer votre certificat ou l'ajouter à votre profil LinkedIn. Si vous souhaitez uniquement lire et visualiser le contenu du cours, vous pouvez auditer le cours gratuitement.
Si vous vous êtes abonné, vous bénéficiez d'une période d'essai gratuite de 7 jours pendant laquelle vous pouvez annuler votre abonnement sans pénalité. Après cette période, nous ne remboursons pas, mais vous pouvez résilier votre abonnement à tout moment. Consultez notre politique de remboursement complète.