GO152 : Introduction à la statistique et à la cartographie en géographie
Jean-Christophe François & Claude Grasland
Université Paris VII / UFR GHSS - Deug de Géographie- 1ere année  / Année 1999-2000 / 2nd Semestre
STAT.4 : LES PARAMETRES DE DISPERSION

 
 
PLAN 
VOCABULAIRE
EXEMPLES
Retour au menu général

 
 
 

PLAN DU CHAPITRE STAT.4

INTRODUCTION : LIMITES DES VALEURS CENTRALES

1. LES PARAMETRES DE DISPERSION ABSOLUE

1.1 L'étendue

1.2 Les quantiles 1.3 L'écart absolu moyen 1.4 L'écart-type 2. RESUMES NUMERIQUES COMBINANT VALEURS CENTRALES ET PARAMETRES DE DISPERSION

2.1 Distribution multimodale

2.2 Distribution unimodale dissymétrique 2.3 Distribution unimodale symétrique 3. LES PARAMETRES DE DISPERSION RELATIVE

3.1 Intérêt des paramètres de dispersion relative

3.2 Calcul des paramètres de dispersion relative 3.3 Limites d'utilisation
 
Pour obtenir un cours de statistique détaillé, mais non centré sur la géographie, cliquez ici

 

VOCABULAIRE DU CHAPITRE STAT.4

 
Limites des valeurs centrales
Le résumé d'une distribution que donne une valeur centrale ne nous renseigne pas sur la dispersion des valeurs autour de cette valeur centrale, c'est-à-dire sur la tendance qu'elles-ont à se concentrer ou se disperser autour de celle-ci.
Exemple : Si l'on considère deux professeurs X et Y chargés de noter 9 élèves, peut-on apprécier leur manière de noter simplement en regardant la moyenne, la médiane ou le mode de leurs notes ?
 
Notation de 9 étudiants par les professeurs X et Y
Etudiant
Notes du Pr X
Notes du Pr Y
A
7
0
B
8
5
C
9
9
D
10
10
E
10
10
F
10
10
G
11
11
H
12
15
I
13
20
mode
10
10
moyenne
10
10
médiane
10
10
Il est donc utile  de compléter les valeurs centrales par un paramètre de dispersion absolue qui donne un ordre de grandeur de l'écart des valeurs entre elles ou, ce qui revient au même, de l'écart des valeurs à la valeur centrale de référence.
 

Dispersion statistique : On appelle dispersion statistique, la tendance qu'ont les valeurs de la distribution d'un caractère à s'étaler, à se disperser les unes par rapport aux autres ou de part et d'autre d'une valeur centrale. On distingue la dispersion absolue (mesurée dans l'unité de mesure du carctère) et la dispersion relative (mesurée par un nombre sans dimension).
 

LES PARAMETRES DE DISPERSION ABSSOLUE
 
 

Les paramètres de dispersion absolue indiquent de combien les valeurs d'une distribution s'écartent en général de la valeur centrale de référence. Un paramètre de dispersion absolue s'exprime toujours dans l'unité de mesure de la variable considérée. Les quatre paramètres de dispersion absolue les plus courants sont l'étendue, l'intervalle interquantiles, l'écart absolu moyen et l'écart type.

1) Etendue : l'étendue d'une distribution est égale à la différence entre la plus grande et la plus petite valeur de la distribution :

Etendue de X = Xmax - Xmin


 
 

2) Mesures de la dispersion statistique en référence à la médiane
 
 

Quantiles : on appelle quantiles les valeurs du caractère qui définissent les bornes d'une partition en classes d'effectifs égaux.
 
 

- Les quartiles sont les trois valeurs qui permettent de découper la distribution en quatre classes d'effectifs égaux. On les note Xq1 , Xq2 et Xq3.

Partition du caractère Xmin Xq1 Xq2 Qq3 Xmax

fréquence des effectifs 25% 25% 25% 25%

Remarque : Xq2 est égal à la médiane.

- L'intervalle interquartile est l'étendue de la distribution sur laquelle se trouvent concentrée la moitié des éléments dont les valeurs de X sont les moins différentes de la médiane. On exclut alors de la distribution les 25% des valeurs les plus faibles et les 25 % des valeurs les plus fortes de X. Cet intervalle se note:(Xq3-Xq1).

- Les déciles sont les neufs valeurs de X qui permettent de découper la distribution en dix classes d'effectifs égaux. 0n les note Xd1...Xd9.

- L'intervalle interdécile est l'étendue de la distribution sur laquelle se trouvent concentrés 80% des éléments dont les valeurs de X sont les moins différentes de la médiane. On exclut alors de la distribution les 10 % des valeurs les plus faibles et les 10 % des valeurs les plus fortes. Il se note (Xd9-Xd1).


 

3) Mesures de la dispersion statistique en référence à la moyenne arithmétique
 

3-1 Ecart absolu moyen : Ce paramètre est la moyenne arithmétique de la valeur absolue des écarts à la moyenne. C'est donc la "distance moyenne à la moyenne".


 
 

Calcul de l'écart absolu moyen des notes du Pr X
i
xi
A
7
3
B
8
2
C
9
1
D
10
0
E
10
0
F
10
0
G
11
1
H
12
2
I
13
3
total
90
12
moyenne
10
12/9 = 1.33
3-2 Variance et écart-type :

- Variance : La variance, notée (s x) ² est la moyenne du carré des écarts à la moyenne.

La variance n'est pas un paramètre de dispersion absolue mais plutôt une mesure globale de la variation d'un caractère de part et d'autre de la moyenne arithmétique (quantité d'information). Pour obtenir un paramètre de dispersion absolue, on effectue la racine carrée de la variance, appelé écart-type et que l'on note s x

- Ecart-type : L'écart type, noté sx est la racine carré de la moyenne du carré des écarts à la moyenne, c'est à dire la racine carrée de la variance.
 


L'écart-type est une mesure de dispersion par rapport à la moyenne qui intègre les valeurs algébriques des écarts à la moyenne et qui pourra, à ce titre être réintroduite dans des calculs algébriques ultérieurs. Elle présente de plus l'avantage d'avoir une signification probabiliste que ne possède pas l'écart absolu moyen. La théorie des probabilités permet en effet d'estimer la chance qu'a une valeur d'être éloignée de la moyenne de plus d'un certain nombre d'écart-types.

Lorsqu'une distribution est gaussienne (on dit aussi "normale") les probabilités de trouver les valeurs a une distance donnée de la moyenne sont les suivantes :

Calcul de la variance et de l'écart-type des notes du Pr X
i
xi
A
7
9
B
8
4
C
9
1
D
10
0
E
10
0
F
10
0
G
11
1
H
12
4
I
13
9
total
90
12
moyenne
10
var = 26/9 = 3.11


LES PARAMETRES DE DISPERSION RELATIVE

La comparaison des paramètres de dispersion absolue de deux caractères n'a de sens que si les deux caractères sont de même nature et de même ordre de grandeur. Dans le cas contraire, la comparaison n'est possible qu'en ayant recours à des mesures de dispersion relative, c'est à dire en effectuant le rapport entre un paramètre de dispersion absolue et la valeur centrale qui lui tient de référence .

Un paramètre de dispersion relative est une mesure de l'écart relatif des valeurs d'une distribution à une valeur centrale. C'est donc le rapport d'un paramètre de dispersion absolue divisé par une valeur centrale. On obtient un nombre sans dimension qui peut être exprimé en %.

Dispersion relative = Paramètre de dispersion absolue/Valeur centrale

- le coefficient interquartile relatif

C.I.R.(X)  = (Xq3-Xq1)/ médiane X

- l'écart moyen relatif

E.M.R.(X)  = E.A.M.(X)  / moyenne(X)

- le coefficient de variation

C.V.(X)  = s(X)  / moyenne(X)

Remarque très importante : Le calcul d'un paramètre de dispersion relative n'est possible que pour les caractères quantitatifs positifs (toutes les modalités sont des nombres positifs).
 
 
 
TAILLE
EPERLAN
BAR
petite 
-2 

5 cm

40 cm
moyenne 

10 cm

50 cm
grande 
+2

15 cm

60 cm

1) en variation absolue, les différences sont plus fortes chez le bar que chez l'éperlan. Ainsi, on voit que les "grands" bars font en moyenne 20 cm de plus que les "petits" bars alors que les "grands" éperlans ne font que 10 cm de plus que les petits éperlans. C'est ce que traduit la différence des paramètres de dispersion absolue : l'écart-type est deux fois plus grand chez le bar que chez l'éperlan.
2) en variation relatives les conclusions sont tout à fait différentes. On constate en effet que les "grands" éperlans sont trois fois plus grands que les "petits" éperlans alors que les "grands" bars ne sont qu'une fois et demi plus grands que les "petits" bars. C'est donc chez l'éperlan que les variations relatives sont les plus fortes, ce qui apparaît facilement si l'on calcule un paramètre de dispersion relative tel que le rapport écart-type/moyenne (coefficient de variation ). Ce rapport est en effet de 25% chez l'éperlan alors qu'il n'est que de 10% chez le bar.
 
   

EXEMPLES DU CHAPITRE STAT.4