Qu'est-ce qu'un nuage de points ? Il s'agit d'un type de graphique utilisé pour montrer la relation entre deux variables. Découvrez comment fonctionnent les nuages de points, qui les utilise et pourquoi.
Read in English (Lire en Anglais).
Un nuage de points est un type de graphique qui permet de visualiser les relations entre deux variables. Son nom vient de la conception du graphique, qui ressemble à une collection de points dispersés sur les axes x et y. Certains nuages de points comportent une droite de régression qui indique la force statistique de la relation. D'autres utilisent plusieurs couleurs pour distinguer les points.
Toute personne travaillant avec des chiffres a probablement été confrontée à un nuage de points à un moment ou à un autre de sa carrière. C'est le cas des scientifiques, des économistes et des chercheurs. Les environnementalistes et les météorologues peuvent également utiliser des nuages de points pour indiquer des variables telles que la température ou les précipitations.
Les deux types de nuages de points sont bidimensionnels (2D) et tridimensionnels (3D). Comme son nom l'indique, un nuage de points 2D présente des coordonnées sur un graphique bidimensionnel avec un axe des x et un axe des y (comme sur une feuille de papier). Un nuage de points en 3D utilise un système de grille tridimensionnel qui incorpore un axe z pour montrer des caractéristiques supplémentaires telles que l'échelle, la taille du produit ou le prix.
Vous pouvez utiliser un nuage de points pour visualiser la relation entre des variables, en particulier lorsque vous recherchez des tendances et souhaitez faire des prévisions. Supposons, par exemple, que vous souhaitiez établir un lien entre la consommation de sucre et le poids. Vous pouvez représenter ce lien sur un nuage de points, dont l'un des axes représente la quantité de sucre consommée par chaque personne au cours d'une période donnée. L'autre axe peut représenter les kilos gagnés ou perdus pendant cette période.
Représenter les données sous cette forme vous aide à les analyser. Vous pouvez voir comment les différents points de données sont liés les uns aux autres.
Lorsque vous visualisez des données sur un nuage de points, vous pouvez généralement voir des corrélations, une mesure de la relation entre les points de données. Une corrélation positive signifie que les deux points de données augmentent. Dans l'exemple de la relation entre la consommation de sucre et le poids, vous pouvez remarquer que les personnes qui consomment plus de sucre prennent également plus de poids. Sur le nuage de points, les points commenceraient dans le coin inférieur gauche du graphique et se déplaceraient vers le coin supérieur droit.
Une corrélation négative signifie qu'un point de données augmente tandis que l'autre diminue. Dans ce cas, les points du nuage de points se déplacent du coin supérieur gauche vers le coin inférieur droit. Si les variables ne sont pas corrélées, les points du nuage de points n'ont pas de forme définie. Une relation curviligne apparaît sur le nuage de points sous la forme d'une courbe, ce qui suggère qu'une variable n'évolue pas à un rythme constant.
Après avoir identifié les corrélations entre les variables, vous pouvez faire des prévisions. Si le nuage de points montre une corrélation positive entre la consommation de sucre et la prise de poids, vous pouvez prédire que vous perdrez du poids si vous réduisez votre consommation de sucre. De même, vous pouvez décider d'ajuster votre budget marketing si vous remarquez une forte corrélation positive entre les ventes et l'engagement sur un canal spécifique.
Les nuages de points sont plus utiles lorsque vous travaillez avec des données numériques appariées et que vous n'avez pas plus de deux variables à examiner. Envisagez d'utiliser un nuage de points dans les cas suivants :
Explorer les causes et les effets possibles : Supposons que vous souhaitiez étudier la relation entre les types de contenu (vidéos, articles de blog, tutoriels, etc.) que vous publiez sur votre site web et les ventes. Vous pourriez collecter des données sur le chiffre d'affaires et les pages web qui ont renvoyé les clients à la conclusion de la vente. L'organisation des données sous forme de nuage de points peut vous aider à identifier le contenu qui mène aux ventes, et vous pouvez ajuster votre stratégie de contenu en conséquence.
Tester les autocorrélations : Si vous remarquez que le nombre de visiteurs d'un site web est le plus élevé le week-end et le plus bas le lundi, vous pouvez utiliser un nuage de points pour rechercher des tendances dans la structure du trafic au fil du temps. Dans ce cas, vous pouvez comparer le nombre de visiteurs le dimanche et le lundi pendant six semaines. Si la tendance se maintient - le trafic du site web atteint son maximum le dimanche et chute le lundi - vous pouvez décider de modifier le type de contenu que vous publiez le lundi.
Examen de la relation entre deux variables : Un directeur des ressources humaines peut utiliser un nuage de points pour étudier le lien entre le salaire des employés et leur sentiment de satisfaction au travail. Après avoir mené une enquête sur la satisfaction au travail, il peut représenter les résultats de l'enquête avec le salaire de chaque employé participant et rechercher le lien entre les deux.
Les personnes qui utilisent des données pour tirer des conclusions et faire des prédictions sont plus susceptibles d'utiliser des nuages de points. Il s'agit notamment des personnes qui travaillent avec des chiffres, comme les économistes, les chefs de projet et les scientifiques. Si vous êtes journaliste spécialisé dans les données, analyste de marché ou chercheur, vous pouvez utiliser les nuages de points pour identifier des tendances et faire des prédictions sur le comportement des gens.
Bien que les nuages de points aident à montrer une relation entre des variables, ils ne sont qu'une des nombreuses façons de visualiser les données. Comprendre les avantages et les inconvénients de ce type de graphique peut vous aider à décider s'il s'agit de l'outil approprié pour votre projet.
Voici quelques avantages et inconvénients de l'utilisation des nuages de points.
Les nuages de points sont faciles à lire. Vous pouvez généralement identifier une corrélation d'un seul coup d'œil.
Les nuages de points peuvent montrer des relations non linéaires. Certaines données peuvent apparaître le long d'une ligne courbe ou d'une formation irrégulière.
Les nuages de points sont faciles à créer. Vous pouvez les dessiner à la main ou les créer dans un programme informatique tel qu'Excel.
Les nuages de points permettent d'identifier les corrélations. Connaître la relation entre les variables est un point de départ pour une analyse plus approfondie.
Les nuages de points ne permettent qu’une analyse limitée. Vous pouvez utiliser un nuage de points pour visualiser deux, voire trois variables, et vous avez donc besoin d'une autre méthode pour une analyse plus approfondie.
Les nuages de points n'indiquent pas de lien de causalité. La corrélation n'est pas la même chose que la causalité - deux variables peuvent être liées positivement ou négativement et déterminéespar d'autres variables qui peuvent ne pas être indiquées sur le nuage de points.
Les nuages de points comportant trop de points de données peuvent être difficiles à lire. Les données qui se chevauchent peuvent altérer les données et ralentir le processus d'analyse.
Vous pouvez dessiner manuellement un nuage de points ou en créer un dans un programme comme Excel, Tableau, Visme et Canva. Si vous apprenez à utiliser un nuage de points, le fait d'en dessiner un à la main peut vous aider à comprendre son fonctionnement. Pour commencer, rassemblez vos données et enregistrez-les dans un graphique à deux colonnes. Si vous souhaitez créer le nuage de points à la main, dessinez un graphique et attribuez une variable à l'axe des x et à l'axe des y. Pour chaque ensemble de données, placez un point sur l'axe des x et un autre sur l'axe des y. Pour chaque ensemble de données, placez un point à l'endroit où les deux valeurs se croisent sur le graphique.
Les nuages de points sont une façon de visualiser les données. Si vous envisagez de travailler dans le domaine de l'analyse des données, il peut être intéressant pour vous d'en apprendre davantage sur les différentes façons de présenter les données et d'en tirer des conclusions. Pensez à suivre un cours comme Introduction to Data Analysis Using Excel de l'Université de Rice ou Data Visualization with Python d'IBM. Ces cours comprennent des sections sur la création de nuages de points et d'autres outils de visualisation des données. Ces deux cours sont disponibles sur Coursera.
Équipe éditoriale
L’équipe éditoriale de Coursera est composée de rédacteurs, de rédacteurs et de vérificateurs de fai...
Ce contenu a été mis à disposition à des fins d'information uniquement. Il est conseillé aux étudiants d'effectuer des recherches supplémentaires afin de s'assurer que les cours et autres qualifications suivis correspondent à leurs objectifs personnels, professionnels et financiers.