Introduction à la statistique sous Excel
Claude Grasland
Université Paris VII / UFR GHSS 
MODULE 1
Création d'un tableau de données - Création de nouvelles variables - Agrégation

Fichier de données : Module1.xls
 

Etape 1 : Saisie et enregistrement d'un tableau de données
 

  1. Lancer Excel
  2. Saisir le tableau de données indiqué ci-dessous
  3. Mettre en forme le tableau (couleurs, bordures, etc.)
  4. Enregistrer le tableau
  5. Faire une copie de sauvegarde


Superficie et population des départements camerounais
Code  Nom Superficie Pop. 1976 Pop. 1987
A1 DJEREM 13283 32830 59369
A2 FARO ET DEO 10435 29844 43904
A3 MAYO-BANYO 8520 68252 92668
A4 MBERE 14267 89912 126859
A5 VINA 15600 102328 168242
B1 HAUTE-SANAGA 11850 56189 79938
B2 LEKIE 2990 203159 239500
B3 MBAM 33030 164421 206799
B4 MEFOU 4155 124367 141166
B5 MFOUNDI 615 313206 704368
B6 NYONG ET KELLE 6360 86668 99535
B7 NYONG ET MFOUMO 6170 72865 86838
B8 NYONG ET SO 3580 77805 97396
C1 BOUMBA ET NGOKO 30630 53323 82102
C2 HAUT-NYONG 36040 115848 150220
C3 KADEY 15910 88197 130715
C4 LOM ET DJEREM 26320 85482 153696
D1 DIAMARE 4665 281881 383949
D2 KAELE 5033 186434 228737
D3 LOGONE ET CHARI 10183 147321 278854
D4 MAYO-DANAY 5300 225114 354181
D5 MAYO-SAVA 2736 160432 209718
D6 MAYO-TSANAGA 4393 304163 425427
E1 MOUNGO 3720 275456 338459
E2 NKAM 6300 34373 41170
E3 SANAGA-MARITIME 9310 112550 135818
E4 WOURI 890 419077 836380
F1 BENOUE 13614 172001 385381
F2 FARO 13624 52277 57671
F3 MAYO-LOUTI 4162 169738 255735
F4 MAYO-REY 36529 67264 164316
G1 BUI 2300 142015 219695
G2 DONGA-MANTUNG 4280 172712 228251
G3 MENTCHUM 6060 183055 218802
G4 MEZAM 2870 298911 429285
G5 MOMO 1790 118219 141771
H1 BAMBOUTOS 1170 155193 213488
H2 HAUT-NKAM 960 104467 140941
H3 MENOUA 1380 201409 250009
H4 MIFI 1170 242316 356979
H5 NDE 1520 67942 82409
H6 NOUN 7690 197529 287375
I1 DJA ET LOBO 19910 99638 125869
I2 NTEM 16000 128514 158840
I3 OCEAN 11280 66776 92528
J1 FAKO 2060 157032 251129
J2 MANYU 10180 152678 217568
J3 MEME 6510 196470 281615
J4 NDIAN 6160 74180 90571
Total CAMEROUN 463504 7131833 10546236

Conseil : Pour vérifier qu'il n'y a pas d'erreurs dans la saisie, faites calculer le total de chacune des colonnes à l'aide de la fonction SOMME et vérifiez qu'il correspond au nombre indiqué sur la ligne CAMEROUN.
 

Etape 2 : Création de nouvelles variables

Lorsque l'on crée une base de données, il faut toujours privilégier la saisie des variables de STOCK (population, superficie, ...) et éviter de saisir des variables de RAPPORT (densité de population, taux d'accroissement, ...) qui peuvent être déduites des premières. Même si l'on ne souhaite utiliser que la densité de population, il est conseillé de saisir séparément la population et la surface et de faire calculer la densité ensuite. Le résultat sera plus précis et les variables de stock pourront être utilisées plus tard pour créer d'autres variables.

Ajoutez à votre tableau de données les 5  variables suivantes :

Densité de population en 1976 = DEN76= POP76/SUP
Densité de population 1987 = DEN87 = POP87 /SUP
Variation absolue de population 1976-1987 = VPOABS= POP87-POP76
Variation relative de population 1976-1987 = VPOREL= (POP87-POP76)/POP76
Taux de croissance moyen annuel de la population entre 1976 et 1987 = [(POP87/POP76)^(1/11) ] -1
 
 
Code  Nom Superficie Pop. 1976 Pop. 1987 Dens. 1976 Dens. 1987 V7687 (abs) V7687 (rel.) V7687 (ann.)
A1 DJEREM 13283 32830 59369 2.5 4.5 26539 81% 5.5%
A2 FARO ET DEO 10435 29844 43904 2.9 4.2 14060 47% 3.6%
A3 MAYO-BANYO 8520 68252 92668 8.0 10.9 24416 36% 2.8%
A4 MBERE 14267 89912 126859 6.3 8.9 36947 41% 3.2%
A5 VINA 15600 102328 168242 6.6 10.8 65914 64% 4.6%
B1 HAUTE-SANAGA 11850 56189 79938 4.7 6.7 23749 42% 3.3%
B2 LEKIE 2990 203159 239500 67.9 80.1 36341 18% 1.5%
B3 MBAM 33030 164421 206799 5.0 6.3 42378 26% 2.1%
B4 MEFOU 4155 124367 141166 29.9 34.0 16799 14% 1.2%
B5 MFOUNDI 615 313206 704368 509.3 1145.3 391162 125% 7.6%
B6 NYONG ET KELLE 6360 86668 99535 13.6 15.7 12867 15% 1.3%
B7 NYONG ET MFOUMO 6170 72865 86838 11.8 14.1 13973 19% 1.6%
B8 NYONG ET SO 3580 77805 97396 21.7 27.2 19591 25% 2.1%
C1 BOUMBA ET NGOKO 30630 53323 82102 1.7 2.7 28779 54% 4.0%
C2 HAUT-NYONG 36040 115848 150220 3.2 4.2 34372 30% 2.4%
C3 KADEY 15910 88197 130715 5.5 8.2 42518 48% 3.6%
C4 LOM ET DJEREM 26320 85482 153696 3.2 5.8 68214 80% 5.5%
D1 DIAMARE 4665 281881 383949 60.4 82.3 102068 36% 2.8%
D2 KAELE 5033 186434 228737 37.0 45.4 42303 23% 1.9%
D3 LOGONE ET CHARI 10183 147321 278854 14.5 27.4 131533 89% 6.0%
D4 MAYO-DANAY 5300 225114 354181 42.5 66.8 129067 57% 4.2%
D5 MAYO-SAVA 2736 160432 209718 58.6 76.7 49286 31% 2.5%
D6 MAYO-TSANAGA 4393 304163 425427 69.2 96.8 121264 40% 3.1%
E1 MOUNGO 3720 275456 338459 74.0 91.0 63003 23% 1.9%
E2 NKAM 6300 34373 41170 5.5 6.5 6797 20% 1.7%
E3 SANAGA-MARITIME 9310 112550 135818 12.1 14.6 23268 21% 1.7%
E4 WOURI 890 419077 836380 470.9 939.8 417303 100% 6.5%
F1 BENOUE 13614 172001 385381 12.6 28.3 213380 124% 7.6%
F2 FARO 13624 52277 57671 3.8 4.2 5394 10% 0.9%
F3 MAYO-LOUTI 4162 169738 255735 40.8 61.4 85997 51% 3.8%
F4 MAYO-REY 36529 67264 164316 1.8 4.5 97052 144% 8.5%
G1 BUI 2300 142015 219695 61.7 95.5 77680 55% 4.0%
G2 DONGA-MANTUNG 4280 172712 228251 40.4 53.3 55539 32% 2.6%
G3 MENTCHUM 6060 183055 218802 30.2 36.1 35747 20% 1.6%
G4 MEZAM 2870 298911 429285 104.2 149.6 130374 44% 3.3%
G5 MOMO 1790 118219 141771 66.0 79.2 23552 20% 1.7%
H1 BAMBOUTOS 1170 155193 213488 132.6 182.5 58295 38% 2.9%
H2 HAUT-NKAM 960 104467 140941 108.8 146.8 36474 35% 2.8%
H3 MENOUA 1380 201409 250009 145.9 181.2 48600 24% 2.0%
H4 MIFI 1170 242316 356979 207.1 305.1 114663 47% 3.6%
H5 NDE 1520 67942 82409 44.7 54.2 14467 21% 1.8%
H6 NOUN 7690 197529 287375 25.7 37.4 89846 45% 3.5%
I1 DJA ET LOBO 19910 99638 125869 5.0 6.3 26231 26% 2.1%
I2 NTEM 16000 128514 158840 8.0 9.9 30326 24% 1.9%
I3 OCEAN 11280 66776 92528 5.9 8.2 25752 39% 3.0%
J1 FAKO 2060 157032 251129 76.2 121.9 94097 60% 4.4%
J2 MANYU 10180 152678 217568 15.0 21.4 64890 43% 3.3%
J3 MEME 6510 196470 281615 30.2 43.3 85145 43% 3.3%
J4 NDIAN 6160 74180 90571 12.0 14.7 16391 22% 1.8%
Total CAMEROUN 463504 7131833 10546236 15.4 22.8 3414403 48% 3.6%

Conseil : Taper la formule de calcul pour le premier département puis utiliser la souris pour recopier la formule sur toute la colonne.
 

Etape 3 : Agrégation de données

Le code des départements camerounais se compose d'une lettre (A, B, ...J) qui indique la province et d'un chiffre qui correspond aux différents départements de la province. Vous devez créer un tableau par province comportant les mêmes informations que le tableau des départements. Attention ! il y a un piège ...
 
 
Code  Nom Superficie Pop. 1976 Pop. 1987 Dens. 1976 Dens. 1987 V7687 (abs) V7687 (rel.) V7687 (ann.)
A Adamaoua 62105 323166 491042 5.2 7.9 167876 52% 3.9%
B Centre 68750 1098680 1655540 16.0 24.1 556860 51% 3.8%
C Est 108900 342850 516733 3.1 4.7 173883 51% 3.8%
D Extrême-Nord 32310 1305345 1880866 40.4 58.2 575521 44% 3.4%
E Littoral 20220 841456 1351827 41.6 66.9 510371 61% 4.4%
F Nord 67929 461280 863103 6.8 12.7 401823 87% 5.9%
G Nord-Ouest 17300 914912 1237804 52.9 71.5 322892 35% 2.8%
H Ouest 13890 968856 1331201 69.8 95.8 362345 37% 2.9%
I Sud  47190 294928 377237 6.2 8.0 82309 28% 2.3%
J Sud-Ouest 24910 580360 840883 23.3 33.8 260523 45% 3.4%
Total CAMEROUN 463504 7131833 10546236 15.4 22.8 3414403 48% 3.6%

Si vous ne trouvez pas les résultats ci-dessus, c'est que vous êtes tombez dans un piège classique de la statistique : la moyenne des taux n'est pas égal au taux moyen.

Explication : La densité moyenne de l'Adamaoua n'est pas égale à la moyenne des densités des départements de l'Adamaoua car ces derniers ont des superficies différentes. Pour trouver la densité de l'Adamaoua il faut calculer la somme des populations et la diviser par la somme des superficies.

En d'autres termes, il faut commencer par AGREGER LES STOCKS (Population, superficie) puis recalculer les taux à partir de ces stocks agrégés.
 

CONCLUSION

Lorsque l'on construit une base de données, il faut toujours PRIVILEGIER LA SAISIE DES VARIABLES DE STOCK car elles constituent l'information centrale à partir de laquelle on peut dériver tous les taux imaginables et tous les niveaux d'agrégation possible.