Préparation à l'épreuve écrite de commentaire de documents Claude Grasland
|
Cours Exercices Bibliographie Menu précédent
Objectifs
1- Apprendre à analyser les principaux avatars d'un tableau de
contingence spatial (profils en ligne, profils en colonne), les figures
associées (diagramme triangulaire), les indices dérivés
(indices de localisation, indices de spécialisation).
2- Apprendre à distinguer les notions de spécialisation
et de dominante.
3- Savoir interpréter les résultats d'une AFC
A. LE TABLEAU DE CONTINGENCE SPATIAL
A.1 Définition d'un tableau de contingence spatial
Un tableau de contingence est un tableau de comptage croisant les modalités de deux caractère discrets A et B. Ce tableau comporte autant de lignes que X a de modalités et autant de colonnes que Y a de modalités. On note Xij l'effectif de la i-ème ligne et j-ième colonne d'un tableau de contingence. Des traitements statistiques spécifiques permettent de décrire les tableaux de contingence (profils en ligne, profils théoriques, déviations) et de tester l'indépendance entre les deux caractères A et B (test du Chi-2.
Un tableau de contingence spatial est un cas particulier de tableau de contingence où le caractère A qui définit les lignes correspond à un ensemble de lieux A1...Ai. Ces tableaux sont très répandus en géographie puisqu'ils ont trait aussi bien à l'occupation des sols, au type de couvert végétal, à la répartition des activités économiques, à la ventilation de la valeur ajoutée, etc.
A titre d'exemple, nous avons montré comment l'on peut établir un tableau de contingence décrivant l'utilisation du sol des communes de la région d'Epinal en combinant différentes sources d'information à l'intérieur d'un SIG
Utilisation du sol (Corine Land Cover) Découpage communal (IGN-INSEE)
Résultat de l'intersection entre les deux sources
CATEGORIES D'UTILISATION DU SOL | ||||||||||
|
Clc11 | Clc12 | Clc13 | Clc14 | Clc21 | Clc22 | Clc23 | Clc24 | Clc31 | Tot |
|
106
|
0
|
0
|
0
|
0
|
0
|
106
|
634
|
740
|
1585
|
|
951
|
211
|
0
|
317
|
106
|
0
|
423
|
106
|
4333
|
6446
|
|
106
|
211
|
211
|
0
|
0
|
0
|
0
|
106
|
423
|
1057
|
|
0
|
106
|
0
|
0
|
106
|
0
|
317
|
211
|
211
|
951
|
|
0
|
0
|
0
|
0
|
0
|
0
|
106
|
0
|
634
|
740
|
|
106
|
0
|
0
|
0
|
0
|
0
|
317
|
634
|
634
|
1691
|
Tableau Simplifié
|
Urbain |
Agicole |
Naturel |
|
|
106
|
740
|
750
|
1596
|
|
1479
|
634
|
4333
|
6446
|
|
528
|
106
|
423
|
1057
|
|
106
|
634
|
211
|
951
|
|
30
|
106
|
634
|
770
|
|
106
|
951
|
634
|
1691
|
|
2355
|
3171
|
6985
|
12511
|
A.2 Calcul du profil des unités spatiales : spécialisations et dominantes
Le tableau de contingence spatial peut faire l'objet des mêmes transformations que les autres tableaux de contingence. En géographie, on privilégie généralement l'analyse des profils en lignes qui permettent de calculer pour chaque unité spatiale la part des différentes modalités qui la décrivent. On peut alors déterminer pour chaque unité spatiale quelle est sa dominante.
Définition : On appelle DOMINANTE la catégorie la plus représentée à l'intérieur d'une unité territoriale
On peut également essayer de calculer des paramètres caractéristiques du profil de l'ensemble des unités (moyenne, minimum, maximum, écart-type, ...).
Ceci permet de procéder à une standardisation des profils de chaqu unité territoriale en prenant comme référence la moyenne et l'écart-type des profils de toutes les unités de la zone étudiée. On peut alors dégager non plus des dominantes mais des spécialisations (écarts au profil général).
Définition : On appelle SPECIALISATION les catégories qui sont sur-représentées par rapport au profil moyen de l'ensemble de référence
L'utilisation des profils standardisés permet de repérer rapidement les spécialisations en donnant des critères objectifs (0 à +1 = faible spécialistaion ; +1 à +2 = forte spécialisation; >+2 = très forte spécialisation). Il existe de très nombreuses applications de cette méthode et de très nombreuses variantes
Détermination des dominates
Commune | Urbain | Agricole | Naturel | Total |
|
88011
|
7%
|
46%
|
47%
|
100%
|
|
88160
|
23%
|
10%
|
67%
|
100%
|
|
88209
|
50%
|
10%
|
40%
|
100%
|
|
88253
|
11%
|
67%
|
22%
|
100%
|
|
88388
|
4%
|
14%
|
82%
|
100%
|
|
88481
|
6%
|
56%
|
37%
|
100%
|
|
Ensemble |
19%
|
25%
|
56%
|
100%
|
|
Détermination des paramètres caractéristiques de l'ensemble des profils
Paramètre | Urbain | Agricole | Naturel |
Minimum |
4%
|
10%
|
22%
|
Maximum |
50%
|
67%
|
82%
|
Moyenne |
17%
|
34%
|
49%
|
Ecart-type |
16%
|
23%
|
20%
|
C.V. |
4%
|
14%
|
82%
|
Détermination des spécialisations :
Commune | Urbain | Agricole | Naturel |
|
88011
|
-0.63
|
0.54
|
-0.12
|
|
88160
|
0.38
|
-1.03
|
0.90
|
|
88209
|
2.06
|
-1.02
|
-0.47
|
|
88253
|
-0.35
|
1.40
|
-1.37
|
|
88388
|
-0.80
|
-0.86
|
1.66
|
|
88481
|
-0.66
|
0.96
|
-0.60
|
|
A.3 Représentations graphiques d'un tableau de contingence spatial
De nombreuses méthodes graphiques et cartographiques permettent de représenter les spécialisations et les dominantes. Dans le cas particulier où les modalités décrivant les lieux sont au nombre de trois, on peut utiliser une réalisation graphique particulière : le diagramme triangulaire.
Source : Calot G., 1984, Cours de statistiques descriptives, Dunod, Paris, p. 262
B. LES INDICES DE SPECIALISATION ET DE LOCALISATION
Des indices synthétiques simples à calculer permettent d'extraire rapidement l'essentiel de l'information contenue dans un tableau de contingence et d'éviter un commentaire trop analytique. Ces indices facilitent l'analyse spatiale du phénomène (quotient de localisation) et permettent de comparer les situations à plusieurs dates.
B.1 Calcul du quotient de localisation
L'indice le plus simple est le quotient de localisation qui peut être calculé indifféremment à partir du tableau de contingence, à partir du tableau des profils en ligne ou à partir du tableau des profils en colonnes.
Définition : On appelle QUOTIENT DE LOCALISATION (Qij) le rapport entre l'effectif observé (Nij) et l'effectif théorique (N*ij) d'une modalité à l'intérieur d'un tableau de contingence spatial.
La valeur attendue de l'indice est Qij=1. Une valeur supérieure à 1 indique une spécialisation du lieu i dans l'activité j ou (ce qui revient au même) une localisation préférentielle de l'activité j dans le lieu i. Une valeur inférieure à 1 indique au contraire une sous-représentation de l'activité i dans le lieu j.
Nomenclature des activités industrielles | |||||||||
ALIM = industries agro-alimentaires ; | |||||||||
TEXT = industries textiles-habillemen | |||||||||
BOIS = industries du bois | |||||||||
EDIT = industries du papier, du carton, de l’imprimerie et de l’édition | |||||||||
CHIM = industries chimiques | |||||||||
CONS = industries des matériaux de construction (ciment, céramique, argile, gypse, chaux, pierre, verre, etc.) | |||||||||
META = sidérurgie, métallurgie des non ferreux, travaux primaires du métal | |||||||||
EQUI = industries de l’équipement industriel et électroménager | |||||||||
Effectifs observés (Nij) | |||||||||
1963 |
|
|
|
|
|
|
|
|
|
BULGARIE |
|
|
|
|
|
|
|
|
|
HONGRIE |
|
|
|
|
|
|
|
|
|
POLOGNE |
|
|
|
|
|
|
|
|
|
R.D.A. |
|
|
|
|
|
|
|
|
|
ROUMANIE |
|
|
|
|
|
|
|
|
|
TCHECO. |
|
|
|
|
|
|
|
|
|
YOUGOSL. |
|
|
|
|
|
|
|
|
|
Total |
|
|
|
|
|
|
|
|
|
Effectifs théoriques (N*ij) | |||||||||
1963 |
|
|
|
|
|
|
|
|
|
BULGARIE |
|
|
|
|
|
|
|
|
|
HONGRIE |
|
|
|
|
|
|
|
|
|
POLOGNE |
|
|
|
|
|
|
|
|
|
R.D.A. |
|
|
|
|
|
|
|
|
|
ROUMANIE |
|
|
|
|
|
|
|
|
|
TCHECO. |
|
|
|
|
|
|
|
|
|
YOUGOSL. |
|
|
|
|
|
|
|
|
|
Total |
|
|
|
|
|
|
|
|
|
Quotients de localisation (Nij/N*ij) | |||||||||
1963 |
|
|
|
|
|
|
|
|
|
BULGARIE |
|
|
|
|
|
|
|
|
|
HONGRIE |
|
|
|
|
|
|
|
|
|
POLOGNE |
|
|
|
|
|
|
|
|
|
R.D.A. |
|
|
|
|
|
|
|
|
|
ROUMANIE |
|
|
|
|
|
|
|
|
|
TCHECO. |
|
|
|
|
|
|
|
|
|
YOUGOSL. |
|
|
|
|
|
|
|
|
|
Total |
|
|
|
|
|
|
|
|
|
L'analyse du tableau des quotients de localisation permet de repérer
très rapidement les spécialisations industrielles des pays
d'Europe de l'Est en 1963 (ex. surreprésentation en Bulgarie des
industries alimentaires, du textile et de la construction) ou bien les
localisations préférentielles des activités (ex. surreprésentation
de l'activité chimique en RDA et, dans une moindre mesure, en Pologne).
On ne perdra toutefois pas de vue que les quotients de localisation
ont trait à des valeurs relatives et non pas des valeurs absolues.
Ainsi, bien que la Bulgarie soit plus spécialisée dans
les industries alimentaires (2.04) et que la RDA soient peu spécialisée
dans cette branche (0.72) on constate que les emplois dans le secteur agro-alimentaire
sont plus nombreux en RDA (206 000) qu'en Bulgarie (130 000) car cette
dernière est moins peuplée et moins industrialisée.
B.2 Calcul des indices de spécialisation et de localisation
Pour déterminer quels sont les lieux qui présentent les plus fortes spécificités par rapport à l'ensemble de référence, on peut établir des indices de spécialisation qui mesurent l'écart global au profil de référence sur l'ensemble des critères définissant les colonnes.
Définition : On appelle INDICE DE SPECIALISATION (Si) l'écart entre le profil d'une unité spatiale et le profil général de l'ensemble de référence. Cette indice, analogue à l'indice de Hoover est strictement compris entre 0 et 1.
Si = 1/2 S j ½
(Nij/Ni.) - (N.j/N..) ½
Inversement, on peut chercher à déterminer les modalités
caractéristiques des lieux qui présentent des répartitions
spatiales atypiques par rapport au profil d'ensemble des lignes définissant
les lieux.
Définition : On appelle INDICE DE LOCALISATION (Lj) l'écart entre le profil d'une activité et le profil général de l'ensemble de référence. Cette indice, analogue à l'indice de Hoover est strictement compris entre 0 et 1.
Lj = 1/2 S i ½ (Nij/N.j) - (Ni./N..) ½
Ces indices sont simples à calculer et leur utilisation est recommandée pour l'épreuve de l'agrégation si l'on est confronté à des tableaux de profils en lignes ou en colonnes. A titre d'exemple, nous indiquons ci-dessous les indices calculés pour 1963 et nous laissons au candidat le soin de les calculer à son tour pour 1988, avant de commenter l'évolution de leurs valeurs entre les deux dates.
DOCUMENT n°5 : CALCUL DES INDICES DE SPECIALISATION ET DE LOCALISATION
Profils en ligne (Nij/Ni.) | |||||||||
1963 | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP | Total |
BULGARIE |
23%
|
23%
|
7%
|
3%
|
5%
|
8%
|
4%
|
27%
|
100%
|
HONGRIE |
13%
|
22%
|
5%
|
3%
|
7%
|
5%
|
8%
|
38%
|
100%
|
POLOGNE |
14%
|
23%
|
6%
|
3%
|
8%
|
7%
|
5%
|
33%
|
100%
|
R.D.A. |
8%
|
18%
|
5%
|
5%
|
12%
|
6%
|
4%
|
42%
|
100%
|
ROUMANIE |
10%
|
22%
|
18%
|
3%
|
5%
|
8%
|
8%
|
26%
|
100%
|
TCHECO. |
9%
|
19%
|
6%
|
3%
|
6%
|
7%
|
8%
|
41%
|
100%
|
YOUGOSL. |
12%
|
21%
|
12%
|
5%
|
7%
|
7%
|
6%
|
29%
|
100%
|
Total |
11%
|
21%
|
8%
|
4%
|
8%
|
7%
|
6%
|
35%
|
100%
|
1963 | Specialisation |
BULGARIE |
16%
|
HONGRIE |
7%
|
POLOGNE |
5%
|
R.D.A. |
12%
|
ROUMANIE |
14%
|
TCHECOSL. |
8%
|
YOUGOSL. |
8%
|
Profils en colonne (Nij/N.j) | |||||||||
1963 | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP | Total |
BULGARIE |
10%
|
5%
|
4%
|
3%
|
3%
|
6%
|
3%
|
4%
|
5%
|
HONGRIE |
11%
|
10%
|
6%
|
7%
|
8%
|
8%
|
13%
|
10%
|
10%
|
POLOGNE |
29%
|
26%
|
19%
|
21%
|
24%
|
25%
|
20%
|
22%
|
23%
|
R.D.A. |
16%
|
19%
|
14%
|
29%
|
33%
|
18%
|
15%
|
26%
|
22%
|
ROUMANIE |
10%
|
13%
|
28%
|
10%
|
8%
|
14%
|
15%
|
9%
|
12%
|
TCHECO. |
14%
|
17%
|
15%
|
16%
|
15%
|
19%
|
25%
|
22%
|
19%
|
YOUGOSL. |
10%
|
9%
|
15%
|
14%
|
8%
|
10%
|
10%
|
8%
|
9%
|
Total |
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
Activ. | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP |
Localis. |
12%
|
4%
|
21%
|
12%
|
12%
|
6%
|
12%
|
8%
|
Exercice : Calculez les indices de spécialisation et de localisation
en 1988. Quelles évolutions peut-on remarquer par rapport à
1963 ?
Effectifs observés (Nij) | ||||||||||||||||||
1988 | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP | TOT | |||||||||
BULGARIE |
150
|
217
|
50
|
26
|
106
|
74
|
51
|
418
|
1092
|
|||||||||
HONGRIE |
203
|
201
|
40
|
33
|
94
|
58
|
79
|
455
|
1163
|
|||||||||
POLOGNE |
428
|
659
|
171
|
93
|
290
|
193
|
183
|
1354
|
3371
|
|||||||||
R.D.A. |
277
|
373
|
122
|
122
|
325
|
148
|
119
|
1433
|
2919
|
|||||||||
ROUMANIE |
181
|
686
|
275
|
51
|
201
|
85
|
241
|
1203
|
2923
|
|||||||||
TCHECOSL |
215
|
407
|
124
|
76
|
190
|
167
|
196
|
1169
|
2544
|
|||||||||
YOUGOSL |
292
|
632
|
212
|
129
|
216
|
124
|
165
|
847
|
2617
|
|||||||||
Total |
1746
|
3175
|
994
|
530
|
1422
|
849
|
1034
|
6879
|
16629
|
1988 | Spec. |
BULGARIE | ? |
HONGRIE | ? |
POLOGNE | ? |
R.D.A. | ? |
ROUMANIE | ? |
TCHECOSL. | ? |
YOUGOSL. | ? |
Profils en ligne (Nij/Ni.) | |||||||||
1988 | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP | Total |
BULGARIE |
14%
|
20%
|
5%
|
2%
|
10%
|
7%
|
5%
|
38%
|
100%
|
HONGRIE |
17%
|
17%
|
3%
|
3%
|
8%
|
5%
|
7%
|
39%
|
100%
|
POLOGNE |
13%
|
20%
|
5%
|
3%
|
9%
|
6%
|
5%
|
40%
|
100%
|
R.D.A. |
9%
|
13%
|
4%
|
4%
|
11%
|
5%
|
4%
|
49%
|
100%
|
ROUMANIE |
6%
|
23%
|
9%
|
2%
|
7%
|
3%
|
8%
|
41%
|
100%
|
TCHECOSL. |
8%
|
16%
|
5%
|
3%
|
7%
|
7%
|
8%
|
46%
|
100%
|
YOUGOSL. |
11%
|
24%
|
8%
|
5%
|
8%
|
5%
|
6%
|
32%
|
100%
|
Total |
10%
|
19%
|
6%
|
3%
|
9%
|
5%
|
6%
|
41%
|
100%
|
Profils en colonne (Nij/N.j) | |||||||||
1988 | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP | Total |
BULGARIE |
9%
|
7%
|
5%
|
5%
|
7%
|
9%
|
5%
|
6%
|
7%
|
HONGRIE |
12%
|
6%
|
4%
|
6%
|
7%
|
7%
|
8%
|
7%
|
7%
|
POLOGNE |
25%
|
21%
|
17%
|
18%
|
20%
|
23%
|
18%
|
20%
|
20%
|
R.D.A. |
16%
|
12%
|
12%
|
23%
|
23%
|
17%
|
12%
|
21%
|
18%
|
ROUMANIE |
10%
|
22%
|
28%
|
10%
|
14%
|
10%
|
23%
|
17%
|
18%
|
TCHECOSL. |
12%
|
13%
|
12%
|
14%
|
13%
|
20%
|
19%
|
17%
|
15%
|
YOUGOSL. |
17%
|
20%
|
21%
|
24%
|
15%
|
15%
|
16%
|
12%
|
16%
|
Total |
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
100%
|
Activ. | ALIM | TEXT | BOIS | EDIT | CHIM | CONS | META | EQUIP |
Localis. | ? | ? | ? | ? | ? | ? | ? | ? |
C. ANALYSE MULTIVARIEE
Si les indices constituent une manière simple et efficace de dégager l'essentiel du contenu d'un tableau de contingence spatiale, ils sont cependant moins efficaces que les méthodes d'analyse multivariées. Les tableaux de contingence spatial se prêtent particulièrement bien à des analyses de ce type et repose sur des méthodes légèrement différentes de celles qui ont été présentées dansle module 4.
C.1 L'Analyse factorielle des correspondances (AFC)
Le fait que les lignes et les colonnes jouent un rôle équivalent dans le tableau de contingence spatial conduit à privilégier une méthode d'analyse factorielle particulière : l'analyse factorielle des correspondances. A la différence de l'analyse en composante principale (ACP), l'analyse factorielle des correspondance fait jouer un rôle symétrique aux lignes et aux colonnes ce qui permet d'interpréter plus facilement les résultats et de les représenter sous la forme d'une figure unique (rappelons que dans le cas de l'ACP les lignes et les colonnes du tableau ont des statuts différents).
Si les deux premiers axes factoriels d'une AFC sont représentatifs (i.e. résument une forte part de l'information initiale contenue dans le tableau), l'interprétation des coordonnées des lignes et des colonnes dans le plan factoriel permet de conduire une analyse synthétique complète des spécialisations, des localisations, des corrélations, ....
Analyse factorielle des correspondance
Classification des pays en 1963 Classification des pays en 1988
C.2 Classification Ascendante Hiérarchique
L'analyse factorielle des correspondances peut-être complétée
par une classification ascendante hiérarchique qui utilisera la
métrique du chi-2 plutôt que la métrique euclidienne
pour tenir compte des spécificités des tableaux de contingence
spatiaux.
A RETENIR :
|
EXERCICE
N°9
Application des notions de spécialisation
et de localisation
sujet : Etude des spécialisations
industrielles aux Etats-Unis
Pour une présentation des notions de dominante/spécialisation et des représentations graphiques ou cartographiques associées, on peut se reporter aux chapitres correspondants dans les ouvrages de statistique et cartographie élémentaires :