Introduction à la statistique sous Excel
Claude Grasland
Université Paris VII / UFR GHSS
MODULE 3
Dénombrement & représentations
graphiques d'un caractère quantitatif continu
|
Fichier de données : Module3.xls
N.B. Il est conseillé de faire une copie de secours du fichier
après l'avoir téléchargé
Etape 1 : Etude de la densité de population
des départements camerounais en 1976
1.1) Tableau de distribution statistique
Objectifs :
-
Extrayez du tableau de données la Densité de population
des départements camerounais en 1976 puis construisez
un tableau Code, Nom, Densité 1976 dans autre feuille.
-
Triez le tableau correspondant par ordre croissant et créez la variable
Rang
-
Que vous apprend ce tableau sur la densité de population des départements
camerounais en 1976 ? Quel est le département le plus peuplé
? le moins peuplé ? ...
Conseils :
-
effectuer un tri du tableau (DONNES/TRIER)
-
saisir 1 pour le rang du département ayant la densité la
plus faible
-
utiliser une copie incrémentée (case du haut + 1)
pour créer les rangs suivants .
Remarques :
-
Pourquoi l'opération de tri est-elle dangereuse ?
-
Quelles précautions faut-il prendre lorsque l'on utilise la fonction
TRI ?
-
Quelles corrections faut-il apporter à la distribution des rangs
en cas de valeurs ex-aequo ?
1.2) Diagramme de distribution
Objectifs :
-
Transformez le tableau de distribution statistique en diagramme de distribution
-
En déduire les zones de concentration et de dispersion des
valeurs de la distribution
-
Proposer une partition en classes selon la méthode des seuils
naturels
Conseils :
-
créer à droite de la colonne densité une colonne
(Y) ne contenant que la valeur 1
-
utiliser le graphique de type "nuage de points"
-
Introduire sur l'axe Y une échelle variant entre 0 et 10
-
Supprimer la légende de l'axe Y
Remarques :
-
Pour rendre la distribution plus lisible on peut transformer l'axe X
en échelle logarithmique
-
On peut également arrondir les valeurs de X et donner les valeurs
Y=1, 2, 3 ... aux ex-aequo
1.3) Courbe des fréquences cumulées
Objectifs :
-
Transformez le tableau de distribution statistique en courbe des fréquences
cumulées ascendantes et descendantes
-
En déduire les zones de concentration et de dispersion des
valeurs de la distribution
-
En déduire la zone de regroupement la plus probable des densités
au Cameroun (80% de valeurs, 50 % des valeurs)
Conseils :
-
créer une colonne (FCA) = rang/N pour les fréquences
cumulées ascendantes (en %)
-
créer une colonne (FCD) = 1-FCA pour les fréquences
cumulées descendantes (en %)
-
Mettre ces colonnes FCA et FCD en format pourcentage.
-
utiliser le graphique de type "nuage de points" pour construire les
deux courbes
-
Obliger l'axe Y a être compris entre 0 et 1 (Excel est stupide !
il ignore qu'une fréquence cumulée est rigoureusement comprise
entre 0 et 100%).
Remarques :
-
Pour avoir une courbes de fréquences cumulées ascendantes
parfaitement exactes il faut utiliser la formule (2*rang-1)/(2N) ui correspond
à une moyenne entre le "strictement inférieur" et le "inférieur
ou égal".
1.4) Tableau de dénombrement - Détermination
du mode de la distribution
Objectifs :
-
Créez trois tableaux de dénombrement comportant 6 classes
et utilisant respectivement (a) la méthode des seuils naturels
(b) la méthode des amplitudes égales (c) la méthode
des effectifs égaux
-
Complétez ces tableaux en indiquant pour chaque classe l'effectif,
la fréquence (%), l'amplitude, le centre de la classe, la fréquence
moyenne.
-
En déduire la classe modale et le mode de la distribution
des densités dans chacune des situations.
Conseils :
-
Utiliser le diagramme de distribution pour construire les classes selon
la méthode des seuils naturels
-
Etendre légèrement la distribution (min et max) pour obtenir
des limites de classes correspondant à des valeurs rondes dans le
cas de la méthode des amplitudes égales.
-
Accepter d'avoir des classes d'effectifs légèrement différents
si la distribution ne se prête pas à la constitution d'effectifs
parfaitement égaux.
-
Utiliser OUTIL/UTILITAIRE D'ANALYSE/HISTOGRAMME pour dénombrer
les effectifs des classes une fois que vous avez trouvé leurs limites.
Mais ne tracez pas l'histogramme d'Excel car il est faux (sauf si
les amplitudes sont égales)
Remarques :
-
La classe modale est celle où les valeurs sont le plus concentrées.
Ce
n'est pas nécessairement celle qui a l'effectif le plus important
...
-
Le mode est le centre de la classe modale.
1.5) Construction d'un histogramme
Objectifs :
-
Construisez les trois histogrammes correspondant à chacune des distributions
précédentes
-
Dans quelle mesure le choix des classes influe-t-il sur la perception des
discontinuités ?
Conseils :
-
N'hésitez pas à tronquer la dernière classe
-
Méfiez-vous d'EXCEL ... Il n'est pas très bon en statistique
et appelle histogramme des choses qui n'ont rien à voir !
Remarques :
-
Si vous n'arrivez pas à faire l'histogramme avec Excel, utilisez
un papier et un crayon ...
-
N'oubliez pas la légende de l'histogramme...
Etape 2 : A vous de jouer ...
Objectifs :
Vous devez étudier la variation de population des départements
camerounais entre 1976 et 1987. Les résultats de votre analyse
ne doivent pas dépasser deux pages et ils comporteront au maximum
2
graphiques et un tableau assortis de commentaires.
Conseils :
-
Réfléchissez bien au choix de l'indicateur retenu
pour mesurer la variation de population (il y a plusieurs solutions et
il faut justifier votre choix).
-
Réfléchissez bien au choix des classes que vous utiliserez
pour dénombrer les départements
-
Réfléchissez bien au choix des graphiques que vous
retiendrez.
-
Soignez bien les légendes des graphiques (titres, sources,...).
-
Enfin, soignez les commentaires en tâchant de rester clair
et concret (pas de jargon statistique ...).