Pierre Mercklé (ENS-LSH), novembre 2003
Seules les questions à réponses uniques ou multiples peuvent être utilisées pour produire des tris croisés. Il faut donc, pour pouvoir les analyser, souvent recoder les variables numériques et les variables textes.
Exemple de l’enquête « défilé danseurs » : la variable numérique « Age ».
D’autres recodages des questions numériques sont possibles (variables calculées sur une ou plusieurs variables, scores, etc.) sont accessibles en sélectionnant « Recoder » ou « Variables calculées » dans le menu « Classement ».
Exemple de l’enquête « défilé danseurs » : la variable texte « Nationalité ».
De nombreux autres recodages sont possibles. Pour les découvrir, essayez de formaliser ce que vous voulez faire, puis explorez les commandes « Recoder », « Dupliquer en changeant le type », « Fusionner », « Variables spéciales », etc., du menu « Classement ».
Exemple de l’enquête « défilé danseurs » : la variable fermée « Nationalité ».
L’objectif de ce type de recodages est de regrouper des modalités dans différentes catégories :
Quelles activités avez-vous pratiquées au cours de votre vie ?
| soirée karaoké |
668 |
42,3% |
| théâtre amateur |
514 |
32,6% |
| jouer d'un instrument de musique |
527 |
33,4% |
| chanter |
533 |
33,8% |
| faire des arts plastiques |
490 |
31,1% |
| pratiquer l'écriture |
409 |
25,9% |
| aucun |
325 |
20,6% |
| Total / répondants |
1578 |
Résultat : un tiers des danseurs interrogés (soit 527 d’entre eux) ont déjà joué d’un instrument de musique au cours de leur vie. Sauf que… Vu la construction du questionnaire, ceux qui avaient joué d’un instrument au cours des 12 derniers mois pouvaient parfaitement être tentés de ne cocher que cette case, et pas la case « au cours de votre vie ». De fait, c’est le cas de… 342 personnes interrogées. Donc, en réalité 869 personnes ont déjà joué d’un instrument au cours de leur vie. La question, telle quelle, est donc inexploitable. Il faut arriver à en fabriquer une qui tienne compte de ce problème.
Voici une solution possible :
Et voilà le résultat :
Activités pratiquées au cours de la vie version finale
| questionnaire |
version corrigée |
|||
| soirée karaoké |
668 |
42,3% |
954 |
60,4% |
| théâtre amateur |
514 |
32,6% |
695 |
44% |
| jouer d'un instrument de musique |
527 |
33,4% |
869 |
55% |
| chanter |
533 |
33,8% |
809 |
51,2% |
| faire des arts plastiques |
490 |
31,1% |
808 |
51,2% |
| pratiquer l'écriture |
409 |
25,9% |
727 |
46% |
| aucun |
325 |
20,6% |
840 |
53,2% |
| Total / répondants |
1578 |
- |
1579 |
- |
On peut ensuite s’amuser à calculer un coefficient multiplicateur pour chaque activité, et s’interroger sur les variations…
Le redressementRedresser un échantillon consiste à affecter aux différentes modalité d’une variable donnée de l’échantillon des coefficients multiplicateurs calculés en fonction de la proportion des différentes catégories non pas dans l’échantillon, mais dans la population de référence de l’enquête.
Exemple de l’enquête « défilé danseurs » : nous connaissions le nombre de danseurs dans chaque groupe de répétition, et donc nous avons pu constater que nous avons eu des « taux d’échantillonnage » très différents selon les groupes. Pour pouvoir parler des « danseurs », et non pas seulement des « danseurs interrogés », et donc supprimer le « biais » lié à la variation du taux d’échantillonnage, il faut « redresser » l’échantillon en fonction de la variable « groupe de répétition ».
Comment effectuer un redressement :
Créer une sous-population permet de restreindre ensuite l’analyse des données à un sous-ensemble d’individus sélectionnés dans l’échantillon en fonction de leurs réponses à une ou plusieurs questions du questionnaire.
Exemple de l’enquête « défilé danseurs » : créer une sous-population regroupant seulement les danseuses de 15 ans et plus.
Un tri à plat correspond à ce qu’en statistiques on appelle un « tableau de fréquences » : c’est un tableau statistique permettant de connaître la distribution, en nombre et en proportion, des individus entre les différentes modalités d’une question à réponse unique ou multiple.
Exemple de l’enquête « défilé danseurs » : la variable « Diplôme le plus élevé ».
Pour créer un tri à plat :
La présentation du tri à plat obtenu peut très largement être modifiée en fonction des besoins : suppression ou affichage des non-réponses, des pourcentages cumulés, calcul des proportions sur les réponses ou sur les répondants pour les questions à réponses multiples, restriction à une sous-population, application d’un redressement, modification de l’ordre des modalités, regroupement de modalités…
Un tri croisé correspond à ce qu’en statistiques on appelle un « tableau de contingence » : c’est un tableau statistique dans lequel sont confrontées les réponses à deux questions différentes, l’une étant figurée en lignes et l’autre en colonnes. Un tel tableau permet de tester l’existence d’une « relation » statistique entre deux variables, et le cas échéant d’établir la forme de cette relation.
Exemple de l’enquête « défilé danseurs » : y a-t-il une relation entre la date de la passation (variable : passation le jour du défilé) et la façon dont ils se sont inscrits pour participer au Défilé (variable : Pour les répétitions de cette année, est-ce que vous vous êtes incrit-e ?…) ?
La présentation du tri croisé obtenu peut très largement être modifiée en fonction des besoins : suppression ou affichage des non-réponses, calcul des proportions sur les réponses ou sur les répondants pour les questions à réponses multiples, affichage des effectifs, des proportions en lignes ou en colonnes, restriction à une sous-population, application d’un redressement, modification de l’ordre des modalités, regroupement de modalités, inversion des variables en lignes et en colonnes…
Pour le déterminer on compare le tri croisé obtenu au tri croisé fictif qu’on obtiendrait s’il n’y avait aucune relation entre les deux variables (mêmes proportions pour chaque modalité que pour le total). Plus la somme des écarts entre le réel et cette fiction est grande, plus la relation entre les deux variable est forte. Cette « somme des écarts à l’indépendance » s’appelle le Khi-deux.
Khi-2 =
Pour déterminer si le Khi-deux obtenu est significatif, autrement dit s’il est suffisamment important, compte tenu de la dimension du tableau, il faut se reporter à la table de Bravais-Pearson, dite table du Khi-Deux :
Table de Bravais-Pearson (table de Khi-2) |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| La
table donne la probabilité
Exemple : avec Cela signifie que la probabilité de rejeter par erreur l’hypothèse d’indépendance est de moins de 0,1%. On dit alors que la relation entre les deux variables est significative au seuil de 99,9%. |
- La description de la relation
Examiner systématiquement les couples de modalités surreprésentées ou au contraire sous-représentées. En tirer une description synthétique de la relation entre les deux variables.
- L’interprétation de la relation
Cette phase correspond à la recherche d’un schéma causal permettant d’expliquer la corrélation. Plusieurs schémas sont envisageables : la variable en lignes est la cause de la variable en colonnes ; la variable en colonnes est la cause de la variable en lignes ; les deux variables sont les effets d’une troisième variable absente de l’analyse.
Ce troisième cas, le plus fréquent, oblige à réaliser de nouveaux tris croisés pour tester les hypothèses interprétatives ainsi formulées… Bon courage !
Comment récupérer les résultats obtenus pour les intégrer dans un article, ou bien dans un logiciel permettant de les modifier à sa guise, ou encore d’en tirer une représentation graphique ?
Le passage par Excel a l’avantage de faciliter grandement le traitement mathématique des données obtenues (par l’écriture de formules de calcul) et leur représentation graphique.