Introduction à la statistique sous Excel
Claude Grasland
Université Paris VII / UFR GHSS
MODULE 5
Mise en relation de deux caracteres
discrets-
Tableau de contingence et test
du chi-2
|
Fichier de données : Module5.xls
N.B. Il est conseillé de faire une copie de secours du fichier
après l'avoir téléchargé
Etape 1 : Evaluation de l'attitude globale des britanniques
face à l'avortement entre 1983 et 1986
1.1) Analyse de la distribution des réponses
toutes années confondues (1983-1986)
Objectifs :
-
Procédez à un dénombrement de la variable AVO (nombre
de circonstances dans lesquelles une femme peut avorter)
-
Présentez vos résultats sous la forme d'un tableau
-
Proposez une ou plusieurs représentations graphiques.
-
Déterminez les valeurs centrales de la distribution.
Conseils :
-
Aucune difficulté particulière pour le dénombrement
(utiliser TABLEAU CROISE DYNAMIQUE)
-
Se reporter aux exemples du module
2 (représentations graphiques) ou du module
4 (valeurs centrales).
Remarques :
-
Est-il gênant de compter 4 fois la même personne (une pour
chaque année) ?
1.2) Analyse de l'évolution de la distribution
des réponses entre 1983 et 1986
Objectifs :
-
Reprenez l'analyse précédente mais en distinguant les années
1983, 1984, 1985 et 1986
-
Présentez vos résultats sous la forme d'un tableau
-
Proposez une représentation graphique unique montrant l'évolution
des opinions.
-
Déterminez les valeurs centrales de la distribution pour chacune
des années.
Conseils :
-
Utiliser un graphique cumulatif pour mieux saisir les différences
entre les années
Remarques :
-
L'évolution de l'opinion en faveur de l'avortement est-elle continue
?
1.3) Regroupement des réponses sur l'avortement
en trois catégories
Objectifs :
-
Proposez un regroupement des attitudes des britanniques face à l'avortement
en 3 catégories ayant des effectifs aussi proches que possibles
("Contre", "Modéré", "Pour")
-
Créez une variable AVO3 qui associe à chaque réponse
une de ces 3 catégories
-
Proposez un nouveau dénombrement.
Conseils :
-
S'appuyer sur les résultats des étapes précédentes
pour choisir les regroupements les plus pertinents.
-
Utiliser la fonction SI pour procéder au recodage de AVO
en AVO3.
Remarques :
-
En quoi le regroupement (recodage) introduit-il une part d'arbitraire
dans l'analyse ?
Etape 2 : Mise en relation de deux variables discrètes
: sexe et attitude face à l'avortement
2.1) Analyse de la distribution des réponses
sur l'avortement (AVO) en fonction du sexe pour l'ensemble de la période
1983-1986
Objectifs :
-
Construisez le tableau de contingence croisant le sexe et l'attitude face
à l'avortement (AVO) pour l'ensemble des réponses de la période
1983-1986
-
Construisez les trois tableaux associés de profil en pourcentage
(% en ligne, % en colonnes, % du total)
-
Construisez le tableau de profil théorique, le tableau des écarts
à l'indépendance et le tableau des Chi-2 de chacune des cellules.
-
Testez l'hypothèse d'indépendance entre sexe et attitude
face à l'avortement avec un seuil de confiance de 10%, 5%, 1%, 0.1%
Conseils :
-
Construire d'abord le tableau de contingence à l'aide de TABLEAU
CROISE DYNAMIQUE
-
Construire tous les autres tableaux à l'aide de formules ou de liaisons
avec le tableau de contingence.
-
Utiliser la fonction statistique KHIDEUX.INVERSE pour déterminer
les valeurs critiques de rejet de l'hypothèse d'indépendance
(évite le recours à une table).
Remarques :
-
Quel tableau de % répond le mieux à la question de savoir
s'il y a une relation entre sexe et attitude face à l'avortement
?
-
Les différences entre hommes et femmes seraient-elles visibles si
on avait simplement calculé les valeurs moyennes de la variable
AVO par sexe ?
2.2) Même analyse mais à l'aide de 3 catégories
de réponses simplifiées (AVO3)
Objectifs :
-
Vérifier si l'on aboutit au même conclusion en utilisant la
variable AVO3 à la place de AVO
Conseils :
-
Tenir compte du fait que le nombre de degrés de liberté est
maintenant plus réduit (2 au lieu de 7).
Remarques :
-
Une agrégation de modalités ne change pas les résultats
si les catégories regroupées ont des profils similaires.
Est-ce le cas ici ?
2.3) Même analyse mais à l'aide de 2 catégories
de réponses simplifiées (AVO2)
Objectifs :
-
Vérifier si l'on aboutit aux mêmes conclusions en créant
une variable AVO2 qui regroupe les "modérés" et les "pour"
dans une catégorie "plutôt pour".
Conseils :
-
Tenir compte du fait que le nombre de degrés de liberté est
maintenant encore plus réduit (1 seul).
Remarques :
-
Pourquoi les conclusions sont-elles maintenant différentes ? En
quoi peut-on parler ici de "manipulation" ?
Etape 3 : A vous de jouer ...
Objectifs :
-
Vous devez réaliser une étude de 8 à 12 pages
intitulée "L'attitude des britanniques face à l'avortement
: situation et évolution au cours de la période 1983-1986"
-
Les questions ne sont pas fixées a priori : c'est à vous
de définir une problématique à partir des informations
disponibles dans le tableau qui est proposé.
-
Vous n'êtes pas obligé d'utiliser toutes les variables proposées
mais vous devez obligatoirement analyser l'évolution chronologique
des relations entre les indicateurs que vous aurez retenus.
Conseils :
-
Définissez un plan clair, avec une introduction et une conclusion.
Pensez à présenter l'enquête et votre problématique
par rapport à celle-ci.
-
Privilégier les relations entre la variable avortement et les autres
variables de cadrage, mais ne pas oublier que ces dernières sont
peut-être corrélées entre elles...
-
Utilisez les graphiques et tableaux avec modération (en évitant
les redondances des uns par rapport aux autres).
-
Validez toutes vos affirmations à l'aide du test du Chi-2 et fixez
vous une règle permettant de définir les relations
"non significatives", "peu significatives", "significatives" ou "très
significatives".
-
Evitez le jargon statistique (placez en note ou en annexe toutes les discussions
"techniques").
Remarques :
-
Le test du chi-2 n'est valide que si 80% des cases du tableau de contingence
ont des effectifs théoriques supérieurs ou égaux à
5. Ceci risque de vous amener à faire des regroupements de modalités
et à recoder les variables. Dans ce cas, il vaut mieux que les regroupements
soient toujours les mêmes tout au long de l'analyse.
-
Lorsque les variables quantitatives (âge) sont transformées
en variables discrètes, il faut bien choisir les classes et les
justifier.
-
Si vous décider de "manipuler" l'information (dissimuler une relation
existante), il faut le faire en connaissance de cause (en d'autres termes,
indiquez le par une note de bas de page).
Barême de notation :
-
Plan-Introduction-Conclusion : 4 pts
-
Statistique-Tableaux-Graphiques : 8 pts
-
Commentaire - Interprétation : 8 pts.