Qu’est-ce qu’un nuage de points ?

Les représentations graphiques comportent des messages que seuls les avertis savent décoder. C’est le cas du nuage de points en statistique. Ce graphique renseigne sur le comportement des différentes variables d’une étude statistique et l’influence que l’une a sur l’autre. Il indique la corrélation entre les données d’une enquête et fournit une vue d’ensemble sur les résultats obtenus après une recherche.

Que comprendre sur un nuage de points ?

On appelle nuage de points, toute représentation graphique de couples de coordonnées issues d’une étude statistique à double variables quantitatives. Ces variables sont dites corrélées lorsque les caractères étudiés dépendent l’un de l’autre. Pour les représenter, on porte le caractère indépendant sur l’axe des abscisses (coordonnées X) et celui dépendant sur l’axe des ordonnées (coordonnées Y). Les points de cordonnées (X ; Y) ainsi représentés ne sont pas reliés entre eux pour obtenir ni une droite, ni une quelconque courbe. Toutefois, un modèle mathématique peut être associé à un nuage de points. On parle dans ces cas de droite de régression.

Prenons l’exemple d’une étude statistique portant sur la relation entre le Quotient Intellectuel (QI) du père et celui de son fils. Ici, le caractère indépendant est le QI du père et le caractère dépendant est le QI du fils. Pour représenter le nuage de points associé à cette série, il suffit de tracer deux axes orthogonaux, l’un horizontal et l’autre vertical. Inscrivez les QI des pères sur l’axe horizontal et les QI des fils sur l’axe vertical en respectant les graduations. Ensuite, placez les points associés à chaque paire de coordonnées (QI du père ; QI de son fils). L’ensemble des points forme le nuage de points.

Lire aussi :  Que savoir sur OMNeT++ ?

Comment interpréter un nuage de points ?

Les nuages de points permettent de voir la force de la relation entre les deux caractères étudiés. De par leurs aspects, ils peuvent indiquer une relation linéaire ou non linéaire, positive ou négative, de concentration ou de dispersion de données, etc. La relation entre deux variables X et Y est dite linéaire lorsque les points obtenus sur le graphique sont assimilables à une ligne droite. Cette forme linéaire peut être marquée ou non. On dit alors que le nuage de points est très étiré ou modérément étiré, respectivement. La relation entre les variables d’une série statistiques est dite non linéaire lorsque le nuage présente des points qui ne peuvent être assimilés à une droite.

Les nuages de points non linéaires peuvent prendre l’allure de n’importe quelles courbes (parabole, ellipse, …) et peuvent être à la fois croissants et décroissants. Par ailleurs, certains nuages se constituent avec des points très rapprochés les uns des autres, on dit que ce sont des nuages de points à données concentrées. Par contre, d’autres présentent des points dispersés dans le plan du graphique, ce sont les nuages à données dispersées. Au-delà de ces relations, un nuage de points peut faire apparaître l’existence de valeurs extrêmes dans un ensemble de données. Les valeurs extrêmes correspondent aux coordonnées des points éloignés de l’ensemble des autres du nuage.

Que signifie nuage de points à corrélation positive ou négative ?

Si le graphique donne des points regroupés le long d’une droite allant du coin de l’origine du repère au sommet supérieur droit, la relation entre les valeurs étudiées est dite positive ou directe. Cela signifie que les variables X et Y évoluent dans un même sens. En reprenant notre exemple, on dira que le QI du fils croit en fonction du QI de son père. Autrement dit, si un père P1 a un QI plus élevé qu’un père P2, alors le fils F1 du père P1 aura tendance à avoir un QI plus grand que le fils F2 du père P2.

Par contre, lorsque le nuage de points prend l’allure d’une ligne qui part du sommet gauche à la base droite du graphique, la relation est dite négative ou inverse. Dans ce cas, les variables X et Y évoluent en sens opposés. On dira pour notre exemple que le QI du fils décroit en fonction de celui de son père. Ce qui signifie que si un père P1 possède un QI plus faible qu’un père P2, alors le fils F1 du père P1 aura probablement un QI plus élevé que le fils F2 du père F2.

Pierre
Les derniers articles par Pierre (tout voir)
Lire aussi :  Tout savoir sur l'empreinte bancaire : fonctionnement, avantages et impacts

Laisser un commentaire