GO152 : Introduction à la statistique et
à la cartographie en géographie
Jean-Christophe François & Claude Grasland
Université Paris VII / UFR GHSS - Deug de Géographie-
1ere année / Année 1999-2000 / 2nd Semestre
STAT.1 : INTRODUCTION
- DEFINITION DE LA STATISTIQUE
|
PLAN DU
CHAPITRE STAT.1
1.1 LA STATISTIQUE DESCRIPTIVE EN GEOGRAPHIE
1.1.1 Qu’est-ce que la statistique ?
-
Tableau de chiffre / méthode d’analyse
-
Statistique descriptive / Statistique inférentielle
-
Statistique univariée / Statistique bivariée / Statistique
multivariée
1.1.2 Usages de la statistique descriptive
-
Résumer l’information
-
Manipuler l’information
1.1.3 Importance de la statistique en géographie
-
Statistique et cartographie
-
Statistique et citoyenneté
1.2. LA COLLECTE DE L’INFORMATION
1.2.1 Les lignes du tableau
-
éléments
-
ensemble observé
1.2.2 Les colonnes du tableau
-
Caractère
-
Modalités d’un caractère
1.3. LES TYPES DE CARACTERES
1.3.1 Caractères qualitatifs
-
nominal / ordinal
-
discret / exhaustif
1.3.2 Caractères quantitatifs
-
mesurable / repérable
-
stock / taux
-
discret /continu
1.4 LES TYPES DE TABLEAUX
1.4.1 Tableau élémentaire
1.4.2 Tableau de contingence
1.4.3 Matrice d’information géographique
Pour obtenir un cours de statistique détaillé, mais non
centré sur la géographie, cliquez
ici. |
VOCABULAIRE
DU CHAPITRE STAT.1
VOCABULAIRE GENERAL
Statistique : le terme statistique désigne à la
fois :
1) l'ensemble des données numériques concernant une catégorie
de faits (sens très ancien). Il s'agit de l'expression dans sa signification
la plus usuelle (ex. "la statistique du chômage en 1995")
2) l'ensemble des méthodes mathématiques permettant :
a) de résumer quantitativement l'information recueillie sur
un ensemble d'éléments au moyen d'une investigation exhaustive.
C'est la statistique descriptive, qui fait l'objet de ce cours.
b) de généraliser à de grands ensembles d'éléments
les conclusions tirées des résultats obtenus avec des ensembles
beaucoup plus restreints appelés échantillons. C'est la statistique
inférentielle ou probabiliste, qui n'est pas abordée dans
cette UV
Ensemble : c'est la collection (le plus souvent finie en géographie)
d'unités, ou d'éléments, sur laquelle porte l'observation.
Pour que cet ensemble soit correctement défini, il faut lui donner
une définition précise de façon à ce que deux
personnes différentes aboutissent toujours à la même
liste d'éléments. L'ensemble des éléments observés
sera appelé E.
Elément : les éléments sont les objets constitutifs
de l'ensemble. Ce sont des objets déterminés dont l'appartenance
à tel ou tel ensemble E est sans ambiguïté. Les éléments
peuvent être désignés par leur position dans le tableau
de données : 1 pour le premier, i pour un élément
quelconque, N pour le dernier élément.
Caractère : les éléments d'un ensemble sont
décrits par un caractère. Cela revient à établir
une correspondance entre chaque élément i de l'ensemble E
et l'ensemble X des modalités du caractère. La fonction f
E -- X i -- xi est une application au sens mathématique (chaque
élément de E a une modalité et une seule dans X).
Modalité : les différentes situations où
les éléments de E peuvent se trouver à l'égard
du caractère considéré, sont les différentes
modalités du caractère X. Ces modalités doivent être
à la fois incompatibles (un élément de E ne peut prendre
qu'une seule modalité) et exhaustive (à chaque élément
de E doit pouvoir correspondre une modalité de X) de sorte que chaque
élément de E ait une modalité et une seule dans X.
Tableau élémentaire : c'est un tableau à
simple entrée où les lignes correspondent aux éléments
de l'ensemble étudié et les colonnes aux caractères
(ou variables) décrivant ces éléments (figure 1).
La première colonne est en principe réservée à
la liste nominale des éléments.
TYPES DE CARACTERES
Caractère qualitatif : les modalités
ne sont pas mesurables, ce sont des noms ou ce qui revient au même
des sigles ou des codes. On ne peut sommer des modalités qualitatives,
on ne peut en calculer la moyenne (si par exemple les codes sont des codes
numériques, ces opérations n'ont aucun sens).
Nominal ou ordinal
caractère qualitatif nominal: il est exprimé
sur une échelle nominale: Chaque modalité est exprimée
par un nom ou un code. Les différentes modalités ne peuvent
être ordonnées.
caractère qualitatif ordinal : il est exprimé
sur une échelle ordinale: les modalités peuvent être
classées dans un certain ordre les unes par rapport aux autres.
Exhaustif ou discret
Un caractère qualitatif exhaustif comporte autant de
modalités différentes que d’élément.
Un caractère qualitatif discret comporte moins de modalités
différentes que d’élément. Plusieurs éléments
ont la même modalité et peuvent être regroupés
en classes.
Il existe donc quatre types principaux de caractères qualitatifs
:
Catégorie
(caractère qualitatif nominal discret) |
Ex. type de relief avec trois modalités (plaine,
montagne, plateau), |
Identifiant
(caractère qualitatif nominal exhaustif) |
Ex. nom des départements français ;
code minéralogique |
Hiérarchie
(caractère qualitatif ordinal discret) |
Ex. taille des villes selon trois modalités
(petite, moyenne, grande) |
Classement
(caractère qualitatif ordinal exhaustif) |
Ex. Rang des départements pour la population
en 1993 |
Caractère quantitatif : les modalités
sont numériques, elles sont par définition ordonnables mais
elles peuvent être additionnées et la moyenne possède
une signification. Trois types de distinctions peuvent être introduites
pour différencier les caractères quantitatifs.
repérable ou mesurable
- quantitatif repérable sur une échelle d'intervalle.
Ces caractères permettent de repérer la position de chaque
élément par rapport à une origine arbitraire. La valeur
0 est donc conventionnelle et ne signifie pas l'absence du phénomène.
Ex. : Latitude, longitude, température, altitude, ...
- quantitatif mesurable sur une échelle numérique
. Le 0 signifie bien l'absence du phénomène
Ex. : population, taux de fécondité, précipitations
stock ou taux
- les caractères quantitatifs de stock expriment des
quantités concrètes : la somme des modalités des éléments
a un sens.
Ex. Population totale d'un département.
- les caractères quantitatifs de taux expriment le rapport
entre deux valeurs, on les appelle parfois caractères de rapport.
Leur total n'a pas de signification.
Ex. Densité de population d'un département , ou proportion
des actifs chômeurs à une date donnée.
discret ou continu
- les caractères quantitatifs discrets sont des caractères
dont les modalités sont des nombres isolés (mais pas forcément
des nombres entiers).
Ex. Nombre de villes de plus de 100 000 h dans chaque département.
- les caractères quantitatifs continus sont des caractères
dont les modalités sont définies sur un intervalle (continu)
de valeur donnée. Il existe une infinité de modalités
possibles.
Ex. Superficie d'un département
SYNTHESE DES TYPES DE CARACTERES
TYPES DE TABLEAUX
Tableau élémentaire : Un tableau élémentaire
est un tableau décrivant un ensemble d’éléments (lignes
du tableau) à l’aide d’un ensemble de caractères (colonnes
du tableau). La première colonne est généralement
réservée à un caractère servant d’identifiant.
En l’absence d’identifiant, on repère les éléments
par leur ordre d’apparition dans le tableau (lignes numérotées
de 1 à N) et on note i un élément quelconque
du tableau et Xi la " modalité prise par l’élément
i
pour
le caractère X. "
Tableau de contingence : Un tableau de contingence, ou tableau à
double entrée, est un cas particulier de tableau élémentaire
où les lignes et les colonnes jouent un rôle symétrique
et où le contenu des cases correspond à des effectifs
qui peuvent être sommés en ligne et en colonne. Tout tableau
de contingence est en fait le résultat de la transformation d’un
tableau élémentaire constitués de deux caractères
discrets X et Y décrivant le même ensemble E. Le nombre de
ligne d’un tableau de contingence (k) correspond au nombre de modalités
du premier caractère discret (X) et le nombre de colonnes (p) correspond
au nombre de modalités du second caractère discret (Y). L’effectif
d’une case, noté Nij, correspond au " nombre
d’éléments du tableau élémentaire E qui prennent
simultanément la modalité i de X et la modalité j
de Y ".
Matrice d’information géographique : ce terme inventé
par le géographe américain B. Berry décrit un tableau
à trois dimensions (cube) dans lequel :
-
les lignes (i) correspondent aux unités géographiques
-
les colonnes (j) correspondent aux caractères permettant de décrire
ces unités géographiques
-
les plans étagés (t) correspondent aux dates ou périodes
pour lesquelles ces attributs ont été mesurés.
Un élément quelconque d’une matrice d’information géographique
se note Xijt et désigne la " situation du lieu
i,
pour le caractère j au temps t ".
Matrice d’information géographique
EXEMPLES
DU CHAPITRE STAT.1