robot TL;DR:

Un nuage de points est un outil d'analyse graphique servant à visualiser et prédire le type de corrélation (positive, négative ou nulle) entre deux variables numériques discrètes.
    ● Le phénomène de sur-traçage complique l'interprétation lorsque les données sont trop nombreuses, exigeant d'effectuer un échantillonnage aléatoire préalable pour analyser correctement un sous-ensemble.
    ● Une corrélation apparente n'impliquant pas systématiquement une causalité directe entre les variables, le recours à des mesures statistiques externes comme le coefficient de corrélation de Pearson s'avère utile pour valider la relation.
    ● La génération informatisée du graphique sur des plateformes telles qu'EdrawMax Online offre la possibilité d'éviter le tracé manuel fastidieux à condition d'importer les données via des formats de fichiers compatibles spécifiques (.csv, .txt, .xls ou .xlsx).


Demandez un résumé à l'IA

Qu'est-ce que le nuage de points ?

A Nuage de points est un outil simple mais puissant pour visualiser les données, qui sont nouvelles dans ce domaine des statistiques et de la science des données. Aujourd'hui, nous allons tout apprendre sur les nuages de points.

So qu'est-ce qu'un nuage de points? Eh bien, « Un nuage de points est un outil graphique pour visualiser la relation entre deux variables différentes d'un même groupe de données ou de groupes de données différents, en traçant les valeurs de données le long d'un système cartésien bidimensionnel. »

La définition ci-dessus deviendra plus précise avec le graphique de dispersion ci-dessous. Les nuages de points sont également connus sous le nom de diagrammes de dispersion or graphiques de dispersion.

what is scatter plot

Le graphique ci-dessus est réalisé avec deux variables différentes ; les diamètres (en centimètres) et la hauteur (en mètres) pour un groupe d'arbres. Alors que l'axe horizontal X représente la largeur, l'axe longitudinal Y représente la hauteur avec chaque point désignant un arbre. Nous pouvons dériver diverses corrélations entre les variables en utilisant de tels graphiques.

Quand utiliser un nuage de points ?

A Le diagramme de dispersion ou graphique analyse la relation entre deux variables discrètes. C'est pourquoi lorsque nous traçons les données agrégées, nous trouvons différentes formes dans lesquelles les données se présentent. L'application la plus largement utilisée d'un nuage de points réside, cependant, dans la découverte de la corrélation qui existe ou non entre les deux variables.

Par exemple, disons que nous connaissons les valeurs d'une variable, mieux représentée le long de l'axe horizontal, et que nous devons déterminer la meilleure prédiction possible pour l'axe vertical. Un graphique de dispersion est très utile dans une telle impasse.

A Le diagramme de dispersion peut être utile dans les scénarios suivants :

  • Pour les données numériques appariées ;
  • Dans les cas où la variable dépendante a plusieurs valeurs pour une seule valeur de la variable indépendante ;
  • Lors de la tentative de découvrir la corrélation entre deux variables, etc.

Avantages et inconvénients des nuages de points

Avantages

Inconvénients

✔ Ils sont simples à dessiner, même lorsque la variable dépendante a plusieurs valeurs ;

✔ Il est facile à interpréter et à comprendre ;

✔ Les maxima et minima sont facilement isolés, donc ils n'affectent pas beaucoup le graphique ;

Les erreurs de calcul peuvent conduire à un tracé erroné qui à son tour peut conduire à une mauvaise analyse des données ;

L'étendue précise de la corrélation ne peut pas toujours être déterminée à partir d'eux ;

Le sur-traçage est un gros problème lors du travail avec de tels graphiques car ils peuvent considérablement conduire à la discrétisation des valeurs.

Comment les variables d'un nuage de points sont-elles liées les unes aux autres ?

Corrélation et coefficient de corrélation :

Le terme corrélation défini comme la nature de la relation entre deux variables (dans ce cas, des variables discrètes) dans toute étude ou enquête statistique.

Un coefficient de corrélation est une mesure statistique de l'étendue ou du degré de cette corrélation. Positive, négative et aucune corrélation sont les trois types. Ainsi, on peut dire qu'un coefficient de corrélation sera positif ou négatif ou 0. Nous examinerons ceux-ci sous peu.

Droite de meilleur ajustement :

La droite de meilleur ajustement est tracée selon les données précédentes collectées et est utilisée pour prédire la corrélation idéale entre deux variables données. Elle agit comme une référence lors du traçage d'un graphique de dispersion.

Types de corrélations :

A. Corrélation positive :

Lorsque la valeur de la variable dépendante augmente avec une augmentation du coût de la variable indépendante, nous disons qu'il y a une corrélation positive entre les deux.

B. Corrélation négative :

Lorsque la valeur de la variable dépendante diminue avec l'augmentation du coût de la variable indépendante ou vice-versa, alors nous disons que les deux variables ont une corrélation négative.

C. Aucune corrélation :

Dans le cas où nous ne trouvons aucune relation apparente entre les deux variables à l'étude, nous disons qu'il n'y a aucune corrélation entre elles.

Exemples de nuages de points

Ex. I : Corrélation positive :

Problème : Trouver la relation entre la facture d'électricité et la température ;

Solution : Les données sont recueillies et tabulées, et les valeurs sont tracées dans un Le diagramme de dispersion comme suit :

scatter plot positive correlation

Source de l'image: wallstreetmojo.com

À partir du nuage de points ci-dessus, nous pouvons voir que la facture d'électricité est moins élevée lorsque la température est comparativement plus basse. Cependant, elle augmente avec une hausse de la température. Il y a d'autres facteurs inclus également, ce qui ne fait pas une relation linéaire. Néanmoins, nous pouvons déduire qu'il y a une corrélation positive entre la hausse de la température et les factures d'électricité.

Ex. II : Corrélation négative :

Problème : Trouver la relation entre l'âge et les heures de sommeil nécessaires ;

Solution : Une fois de plus, les données recueillies sont après enquête, et un graphique de dispersion créé comme suit :

scatter plot negative correlation

Source de l'image: shmoop.com

Nous pouvons voir sur le graphique qu'à mesure que l'âge augmente, la quantité de sommeil diminue. Ainsi, nous pouvons dire qu'il y a une corrélation négative claire. Cependant, les données ici sont restreintes jusqu'à l'âge de 20 ans, ce qui signifie que la relation pourrait ou non changer pour des valeurs plus élevées de l'âge.

Ex. III : Aucune corrélation :

Dans un tel scénario, il n'y a aucune relation entre les deux variables, et nous pouvons le voir à partir d'un Le diagramme de dispersion car il n'y a aucune direction pour les valeurs. Ici, nous avons pris deux variables indépendantes comme par exemple la taille et les heures d'étude. Elles n'ont aucune relation apparente avec le graphique si tracé ressemblera à quelque chose comme ceci :

scatter plot no correlation

Source de l'image: gstatic.com

Comment créer un nuage de points avec EdrawMax Online ?

De nos jours, créer un diagramme de dispersion est devenu très facile. Vous n'avez plus besoin de le faire avec un stylo et du papier, même si c'est ainsi que nous apprenons. Encore une fois, au niveau professionnel, les meilleurs résultats sont toujours obtenus lorsque vous utilisez un outil de création de diagrammes comme EdrawMax Online, pour créer Les nuages de points. C'est un excellent outil à avoir dans votre inventaire. De plus, étant un outil en ligne, vous n'avez pas besoin de le télécharger sur votre ordinateur.

Avant de dessiner un graphique de dispersion, vous devez comprendre les différentes corrélations et coefficients de corrélation comme décrit ci-dessus.

  • « +1 » signifie une corrélation linéaire positive ;
  • « 0 » signifie aucune corrélation ;
  • « -1 » signifie une corrélation linéaire négative ;
  • Si la valeur du coefficient est égale à 0
  • Si la valeur du coefficient est -1

Deuxièmement, familiarisez-vous avec l'interface d'EdrawMax Online.

star icon Note G2 : 4,5/5 (Plus de 2360 réponses)
seguridad garantizada100% sûr | Sans annonces |ai Propulsé par l'IA

Une fois cela pris en charge, voyons comment nous pouvons créer un nuage de points en utilisant EdrawMax Online :

  • Étape 1 : Dans votre navigateur Web, ouvrez la page d'accueil et connectez-vous avec vos identifiants
  • Étape 2 : Dans le menu « Graphiques et diagrammes », sélectionnez l'option « Dispersion » et une fenêtre de dessin s'ouvre
  • Étape 3 : À gauche du canevas de dessin, vous trouverez des modèles prédéfinis à utiliser ; sélectionnez celui que vous souhaitez glisser-déposer sur le canevas
  • Étape 4 : Vous pouvez tracer manuellement chaque donnée, ou vous pouvez l'extraire d'un fichier enregistré ; pour ce dernier, survolez le bouton d'action en haut à droite du graphique et cliquez sur l'option « Charger les données à partir d'un fichier »
  • Étape 5 : Sélectionnez le fichier en question ; il prend en charge les types de fichiers .csv, .txt, .xls, .lsx, etc.
  • Étape 6 : Ce faisant, vous verrez le graphique de dispersion changer en conséquence
  • Étape 7 : Vous pouvez afficher ou masquer l'étiquette de données et même la modifier en double-cliquant dessus ; pour faire le premier, vous devez sélectionner la même option dans le bouton d'action en haut à droite
  • Étape 8 : Vous pouvez également ajouter ou supprimer un point à partir du bouton d'action
  • Étape 9 : Vous pouvez définir des valeurs minimales et maximales au même endroit
  • Étape 10 : Une fois le graphique finalisé, enregistrez votre travail sur le cloud Google

Problèmes courants que vous pouvez rencontrer

1. Sur-traçage :
  • Cela se produit lorsqu'il y a trop de valeurs de données ;
  • Cela rend difficile la compréhension de la corrélation entre les variables et le calcul de la mesure devient donc difficile ;

Solution : Effectuez un échantillonnage aléatoire des valeurs de données et tracez ces échantillons car il s'agit d'un sous-ensemble de l'ensemble de données complet.

2. La corrélation n'implique pas la causalité :
  • Même si nous pouvons trouver une corrélation entre deux variables, cela ne signifie pas qu'elles sont responsables du comportement l'une de l'autre ; une troisième variable peut affecter l'action et passer inaperçue ;

Solution : Dans de tels cas, différents outils, tels que le coefficient de corrélation de Pearson, s'avèrent utiles.

Dans cette fenêtre, vous pouvez créer votre schéma de câblage en choisissant différents symboles de schéma de câblage dans la bibliothèque de symboles. Il existe divers symboles disponibles tels que les chemins de transmission, les symboles qualificatifs, les dispositifs à semi-conducteurs, les interrupteurs et relais, et autres symboles électriques nécessaires.

Daniel Belisario
Daniel Belisario Jun 02, 26
Partager les articles:
download EdrawMax EdrawMax online
main page