AGREGATION DE GEOGRAPHIE
Préparation à l'épreuve écrite de commentaire de documents

Claude Grasland
Université Paris VII / UFR GHSS / Année 2001-2002 

Module n°5
SPECIALISATION & LOCALISATION
(Le tableau de contingence spatial)

Cours  Exercices  Bibliographie  Menu précédent

Cours

Objectifs

1- Apprendre à analyser les principaux avatars d'un tableau de contingence spatial (profils en ligne, profils en colonne), les figures associées (diagramme triangulaire), les indices dérivés (indices de localisation, indices de spécialisation).
2- Apprendre à distinguer les notions de spécialisation et de dominante.
3- Savoir interpréter les résultats d'une AFC

A. LE TABLEAU DE CONTINGENCE SPATIAL

A.1 Définition d'un tableau de contingence spatial

Un tableau de contingence est un tableau de comptage croisant les modalités de deux caractère discrets A et B. Ce tableau comporte autant de lignes que X a de modalités et autant de colonnes que Y a de modalités. On note Xij l'effectif de la i-ème ligne et j-ième colonne d'un tableau de contingence. Des traitements statistiques spécifiques permettent de décrire les tableaux de contingence (profils en ligne, profils théoriques, déviations) et de tester l'indépendance entre les deux caractères A et B (test du Chi-2.

Un tableau de contingence spatial est un cas particulier de tableau de contingence où le caractère A qui définit les lignes correspond à un ensemble de lieux A1...Ai. Ces tableaux sont très répandus en géographie puisqu'ils ont trait aussi bien à l'occupation des sols, au type de couvert végétal, à la répartition des activités économiques, à la ventilation de la valeur ajoutée, etc.

A titre d'exemple, nous avons montré comment l'on peut établir un tableau de contingence décrivant l'utilisation du sol des communes de la région d'Epinal en combinant différentes sources d'information à l'intérieur d'un SIG



DOCUMENT n°1 : EXEMPLE DE CONSTRUCTION D'UN TABLEAU DE CONTINGENCE
Source : Données satellitaires - Cartes topographiques -  Données administratives
 
 

Utilisation du sol (Corine Land Cover)     Découpage communal (IGN-INSEE)

Résultat de l'intersection entre les deux sources
CATEGORIES D'UTILISATION DU SOL
Commune
Clc11 Clc12 Clc13 Clc14 Clc21 Clc22 Clc23 Clc24 Clc31 Tot
88011
106
0
0
0
0
0
106
634
740
1585
88160
951
211
0
317
106
0
423
106
4333
6446
88209
106
211
211
0
0
0
0
106
423
1057
88253
0
106
0
0
106
0
317
211
211
951
88388
0
0
0
0
0
0
106
0
634
740
88481
106
0
0
0
0
0
317
634
634
1691
Surfaces en hectares

Tableau Simplifié
Commune
Clc 1

Urbain

Clc2

Agicole

Clc3

Naturel

Total
88011
106
740
750
1596
88160
1479
634
4333
6446
88209
528
106
423
1057
88253
106
634
211
951
88388
30
106
634
770
88481
106
951
634
1691
Ensemble
2355
3171
6985
12511
Surfaces en hectares


A.2 Calcul du profil des unités spatiales : spécialisations et dominantes

Le tableau de contingence spatial peut faire l'objet des mêmes transformations que les autres tableaux de contingence. En géographie, on privilégie généralement l'analyse des profils en lignes qui permettent de calculer pour chaque unité spatiale la part des différentes modalités qui la décrivent. On peut alors déterminer pour chaque unité spatiale quelle est sa dominante.

Définition : On appelle DOMINANTE la catégorie la plus représentée à l'intérieur d'une unité territoriale

On peut également essayer de calculer des paramètres caractéristiques du profil de l'ensemble des unités (moyenne, minimum, maximum, écart-type, ...).

Ceci permet de procéder à une standardisation des profils de chaqu unité territoriale en prenant comme référence la moyenne et l'écart-type des profils de toutes les unités de la zone étudiée. On peut alors dégager non plus des dominantes mais des spécialisations (écarts au profil général).

Définition : On appelle SPECIALISATION les catégories qui sont sur-représentées par rapport au profil moyen de l'ensemble de référence

L'utilisation des profils standardisés permet de repérer rapidement les spécialisations en donnant des critères objectifs (0 à +1 = faible spécialistaion ; +1 à +2 = forte spécialisation; >+2 = très forte spécialisation). Il existe de très nombreuses applications de cette méthode et de très nombreuses variantes



DOCUMENT n°2 : CALCUL DES SPECIALISATIONS ET DES DOMINANTES

Détermination des dominates
Commune Urbain Agricole Naturel Total
Dominante
88011
7%
46%
47%
100%
N
88160
23%
10%
67%
100%
N
88209
50%
10%
40%
100%
U
88253
11%
67%
22%
100%
A
88388
4%
14%
82%
100%
N
88481
6%
56%
37%
100%
A
Ensemble
19%
25%
56%
100%
N

Détermination des paramètres caractéristiques de l'ensemble des profils
Paramètre Urbain Agricole Naturel
Minimum
4%
10%
22%
Maximum
50%
67%
82%
Moyenne
17%
34%
49%
Ecart-type
16%
23%
20%
C.V.
4%
14%
82%

Détermination des spécialisations :
Commune Urbain Agricole Naturel
Spécialisations
88011
-0.63
0.54
-0.12
A
88160
0.38
-1.03
0.90
NU
88209
2.06
-1.02
-0.47
UUU
88253
-0.35
1.40
-1.37
AA
88388
-0.80
-0.86
1.66
NN
88481
-0.66
0.96
-0.60
A

A.3 Représentations graphiques d'un tableau de contingence spatial

De nombreuses méthodes graphiques et cartographiques permettent de représenter les spécialisations et les dominantes. Dans le cas particulier où les modalités décrivant les lieux sont au nombre de trois, on peut utiliser une réalisation graphique particulière : le diagramme triangulaire.



DOCUMENT n°3 : UTILISATION DU DIAGRAMME TRIANGULAIRE

Source : Calot G., 1984, Cours de statistiques descriptives, Dunod, Paris, p. 262


 


B. LES INDICES DE SPECIALISATION ET DE LOCALISATION

Des indices synthétiques simples à calculer permettent d'extraire rapidement l'essentiel de l'information contenue dans un tableau de contingence et d'éviter un commentaire trop analytique. Ces indices facilitent l'analyse spatiale du phénomène (quotient de localisation) et permettent de comparer les situations à plusieurs dates.

B.1 Calcul du quotient de localisation

L'indice le plus simple est le quotient de localisation qui peut être calculé indifféremment à partir du tableau de contingence, à partir du tableau des profils en ligne ou à partir du tableau des profils en colonnes.

Définition : On appelle QUOTIENT DE LOCALISATION (Qij) le rapport entre l'effectif observé (Nij) et l'effectif théorique (N*ij) d'une modalité à l'intérieur d'un tableau de contingence spatial.

La valeur attendue de l'indice est Qij=1. Une valeur supérieure à 1 indique une spécialisation du lieu i dans l'activité j ou (ce qui revient au même) une localisation préférentielle de l'activité j dans le lieu i. Une valeur inférieure à 1 indique au contraire une sous-représentation de l'activité i dans le lieu j.



DOCUMENT n°4 : EXEMPLE DE CALCUL DES QUOTIENTS DE LOCALISATION
Exemple : La répartition de l'emploi industriel par branches dans 7 pays d'Europe de l'Est en 1963
 
Nomenclature des activités industrielles
ALIM = industries agro-alimentaires ;
TEXT = industries textiles-habillemen
BOIS = industries du bois
EDIT = industries du papier, du carton, de l’imprimerie et de l’édition
CHIM = industries chimiques
CONS = industries des matériaux de construction (ciment, céramique, argile, gypse, chaux, pierre, verre, etc.)
META = sidérurgie, métallurgie des non ferreux, travaux primaires du métal 
EQUI = industries de l’équipement industriel et électroménager
Effectifs observés (Nij)
1963
ALIM
TEXT
BOIS
EDIT
CHIM
CONS
META
EQUIP
Total
BULGARIE
130
128
39
14
29
47
21
151
559
HONGRIE
144
241
53
28
77
61
91
423
1118
POLOGNE
380
612
164
84
222
199
147
881
2689
R.D.A.
206
451
119
118
308
142
109
1056
2509
ROUMANIE
136
305
244
41
76
114
106
366
1388
TCHECO.
185
412
130
63
139
151
177
883
2140
YOUGOSL.
126
223
132
58
76
78
69
307
1069
Total
1307
2372
881
406
927
792
720
4067
11472
Effectifs théoriques (N*ij)
1963
ALIM
TEXT
BOIS
EDIT
CHIM
CONS
META
EQUIP
Total
BULGARIE
64
116
43
20
45
39
35
198
559
HONGRIE
127
231
86
40
90
77
70
396
1118
POLOGNE
306
556
207
95
217
186
169
953
2689
R.D.A.
286
519
193
89
203
173
157
889
2509
ROUMANIE
158
287
107
49
112
96
87
492
1388
TCHECO.
244
442
164
76
173
148
134
759
2140
YOUGOSL.
122
221
82
38
86
74
67
379
1069
Total
1307
2372
881
406
927
792
720
4067
11472
Quotients de localisation (Nij/N*ij)
1963
ALIM
TEXT
BOIS
EDIT
CHIM
CONS
META
EQUIP
Total
BULGARIE
2.04
1.11
0.91
0.71
0.64
1.22
0.60
0.76
1.00
HONGRIE
1.13
1.04
0.62
0.71
0.85
0.79
1.30
1.07
1.00
POLOGNE
1.24
1.10
0.79
0.88
1.02
1.07
0.87
0.92
1.00
R.D.A.
0.72
0.87
0.62
1.33
1.52
0.82
0.69
1.19
1.00
ROUMANIE
0.86
1.06
2.29
0.83
0.68
1.19
1.22
0.74
1.00
TCHECO.
0.76
0.93
0.79
0.83
0.80
1.02
1.32
1.16
1.00
YOUGOSL.
1.03
1.01
1.61
1.53
0.88
1.06
1.03
0.81
1.00
Total
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00
1.00

L'analyse du tableau des quotients de localisation permet de repérer très rapidement les spécialisations industrielles des pays d'Europe de l'Est en 1963 (ex. surreprésentation en Bulgarie des industries alimentaires, du textile et de la construction) ou bien les localisations préférentielles des activités (ex. surreprésentation de l'activité chimique en RDA et, dans une moindre mesure, en Pologne).
On ne perdra toutefois pas de vue que les quotients de localisation ont trait à des valeurs relatives et non pas des valeurs absolues. Ainsi, bien que la Bulgarie soit plus  spécialisée dans les industries alimentaires (2.04) et que la RDA soient peu spécialisée dans cette branche (0.72) on constate que les emplois dans le secteur agro-alimentaire sont plus nombreux en RDA (206 000) qu'en Bulgarie (130 000) car cette dernière est moins peuplée et moins industrialisée.


B.2 Calcul des indices de spécialisation et de localisation

Pour déterminer quels sont les lieux qui présentent les plus fortes spécificités par rapport à l'ensemble de référence, on peut établir des indices de spécialisation qui mesurent l'écart global au profil de référence sur l'ensemble des critères définissant les colonnes.

Définition : On appelle INDICE DE SPECIALISATION (Si) l'écart entre le profil d'une unité spatiale et le profil général de l'ensemble de référence. Cette indice, analogue à l'indice de Hoover est strictement compris entre 0 et 1.

Si = 1/2 S j ½ (Nij/Ni.) - (N.j/N..) ½
 

Inversement, on peut chercher à déterminer les modalités caractéristiques des lieux qui présentent des répartitions spatiales atypiques par rapport au profil d'ensemble des lignes définissant les lieux.
 

Définition : On appelle INDICE DE LOCALISATION (Lj) l'écart entre le profil d'une activité et le profil général de l'ensemble de référence. Cette indice, analogue à l'indice de Hoover est strictement compris entre 0 et 1.

Lj = 1/2 S i ½ (Nij/N.j) - (Ni./N..) ½

Ces indices sont simples à calculer et leur utilisation est recommandée pour l'épreuve de l'agrégation si l'on est confronté à des tableaux de profils en lignes ou en colonnes. A titre d'exemple, nous indiquons ci-dessous les indices calculés pour 1963 et nous laissons au candidat le soin de les calculer à son tour pour 1988, avant de commenter l'évolution de leurs valeurs entre les deux dates.


DOCUMENT n°5 : CALCUL DES INDICES DE SPECIALISATION ET DE LOCALISATION
 
Profils en ligne (Nij/Ni.)
1963 ALIM TEXT BOIS EDIT CHIM CONS META EQUIP Total
BULGARIE
23%
23%
7%
3%
5%
8%
4%
27%
100%
HONGRIE
13%
22%
5%
3%
7%
5%
8%
38%
100%
POLOGNE
14%
23%
6%
3%
8%
7%
5%
33%
100%
R.D.A.
8%
18%
5%
5%
12%
6%
4%
42%
100%
ROUMANIE
10%
22%
18%
3%
5%
8%
8%
26%
100%
TCHECO.
9%
19%
6%
3%
6%
7%
8%
41%
100%
YOUGOSL.
12%
21%
12%
5%
7%
7%
6%
29%
100%
Total
11%
21%
8%
4%
8%
7%
6%
35%
100%
1963 Specialisation
BULGARIE
16%
HONGRIE
7%
POLOGNE
5%
R.D.A.
12%
ROUMANIE
14%
TCHECOSL.
8%
YOUGOSL.
8%

 
Profils en colonne (Nij/N.j)
1963 ALIM TEXT BOIS EDIT CHIM CONS META EQUIP Total
BULGARIE
10%
5%
4%
3%
3%
6%
3%
4%
5%
HONGRIE
11%
10%
6%
7%
8%
8%
13%
10%
10%
POLOGNE
29%
26%
19%
21%
24%
25%
20%
22%
23%
R.D.A.
16%
19%
14%
29%
33%
18%
15%
26%
22%
ROUMANIE
10%
13%
28%
10%
8%
14%
15%
9%
12%
TCHECO.
14%
17%
15%
16%
15%
19%
25%
22%
19%
YOUGOSL.
10%
9%
15%
14%
8%
10%
10%
8%
9%
Total
100%
100%
100%
100%
100%
100%
100%
100%
100%
Activ. ALIM TEXT BOIS EDIT CHIM CONS META EQUIP
Localis.
12%
4%
21%
12%
12%
6%
12%
8%

Exercice : Calculez les indices de spécialisation et de localisation en 1988. Quelles évolutions peut-on remarquer par rapport à 1963 ?
 
Effectifs observés (Nij)
1988 ALIM TEXT BOIS EDIT CHIM CONS META EQUIP TOT
BULGARIE
150
217
50
26
106
74
51
418
1092
HONGRIE
203
201
40
33
94
58
79
455
1163
POLOGNE
428
659
171
93
290
193
183
1354
3371
R.D.A.
277
373
122
122
325
148
119
1433
2919
ROUMANIE
181
686
275
51
201
85
241
1203
2923
TCHECOSL
215
407
124
76
190
167
196
1169
2544
YOUGOSL
292
632
212
129
216
124
165
847
2617
Total
1746
3175
994
530
1422
849
1034
6879
16629

 
 
 
 
1988 Spec.
BULGARIE ?
HONGRIE ?
POLOGNE ?
R.D.A. ?
ROUMANIE ?
TCHECOSL. ?
YOUGOSL. ?

 
 
Profils en ligne (Nij/Ni.)
1988 ALIM TEXT BOIS EDIT CHIM CONS META EQUIP Total
BULGARIE
14%
20%
5%
2%
10%
7%
5%
38%
100%
HONGRIE
17%
17%
3%
3%
8%
5%
7%
39%
100%
POLOGNE
13%
20%
5%
3%
9%
6%
5%
40%
100%
R.D.A.
9%
13%
4%
4%
11%
5%
4%
49%
100%
ROUMANIE
6%
23%
9%
2%
7%
3%
8%
41%
100%
TCHECOSL.
8%
16%
5%
3%
7%
7%
8%
46%
100%
YOUGOSL.
11%
24%
8%
5%
8%
5%
6%
32%
100%
Total
10%
19%
6%
3%
9%
5%
6%
41%
100%
Profils en colonne (Nij/N.j)
1988 ALIM TEXT BOIS EDIT CHIM CONS META EQUIP Total
BULGARIE
9%
7%
5%
5%
7%
9%
5%
6%
7%
HONGRIE
12%
6%
4%
6%
7%
7%
8%
7%
7%
POLOGNE
25%
21%
17%
18%
20%
23%
18%
20%
20%
R.D.A.
16%
12%
12%
23%
23%
17%
12%
21%
18%
ROUMANIE
10%
22%
28%
10%
14%
10%
23%
17%
18%
TCHECOSL.
12%
13%
12%
14%
13%
20%
19%
17%
15%
YOUGOSL.
17%
20%
21%
24%
15%
15%
16%
12%
16%
Total
100%
100%
100%
100%
100%
100%
100%
100%
100%

 
 
Activ. ALIM TEXT BOIS EDIT CHIM CONS META EQUIP
Localis. ? ? ? ? ? ? ? ?


C. ANALYSE MULTIVARIEE

Si les indices constituent une manière simple et efficace de dégager l'essentiel du contenu d'un tableau de contingence spatiale, ils sont cependant moins efficaces que les méthodes d'analyse multivariées. Les tableaux de contingence spatial se prêtent particulièrement bien à des analyses de ce type et repose sur des méthodes légèrement différentes de celles qui ont été présentées dansle module 4.

C.1 L'Analyse factorielle des correspondances (AFC)

Le fait que les lignes et les colonnes jouent un rôle équivalent dans le tableau de contingence spatial conduit à privilégier une méthode d'analyse factorielle particulière : l'analyse factorielle des correspondances. A la différence de l'analyse en composante principale (ACP), l'analyse factorielle des correspondance fait jouer un rôle symétrique aux lignes et aux colonnes ce qui permet d'interpréter plus facilement les résultats et de les représenter sous la forme d'une figure unique (rappelons que dans le cas de l'ACP les lignes et les colonnes du tableau ont des statuts différents).

Si les deux premiers axes factoriels d'une AFC sont représentatifs (i.e. résument une forte part de l'information initiale contenue dans le tableau), l'interprétation des coordonnées des lignes et des colonnes dans le plan factoriel  permet de conduire une analyse synthétique  complète des spécialisations, des localisations, des corrélations, ....



DOCUMENT n°6 : EXEMPLE D'UTILISATION DE L'ANALYSE MULTIVARIEE

Analyse factorielle des correspondance

Classification des pays en 1963 Classification des pays en 1988


C.2 Classification Ascendante Hiérarchique

L'analyse factorielle des correspondances peut-être complétée par une classification ascendante hiérarchique qui utilisera la métrique du chi-2 plutôt que la métrique euclidienne pour tenir compte des spécificités des tableaux de contingence spatiaux.
 

A RETENIR :
 
  • Le tableau de contingence spatial est un type particulier mais très fréquent de matrice d'information géographique.
  • Il ne faut pas confondre lignes et des colonnes (attention aux pourcentages !)
  • Lorsque les attributs non spatiaux sont réduits à trois, on peut représenter ces tableau à l'aide d'un graphique triangulaire.
  • Les indices ou quotients de spécialisation et localisation permettent une analyse rapide mais efficaces des tableaux de ce type. 
  • L'analyse factorielle des correspondance permet une analyse plus poussée.

Exercices

EXERCICE N°9
    Application des notions de spécialisation et de localisation
     sujet : Etude des spécialisations industrielles aux Etats-Unis
 


 

Bibliographie

Pour une présentation des notions de dominante/spécialisation et des représentations graphiques ou cartographiques associées, on peut se reporter aux chapitres correspondants dans les ouvrages de statistique et cartographie élémentaires :

Pour une présentation de l'analyse factorielle des correspondances et des méthodes de classification associées, voir :