Tri à plat et tri croisé

Site: IRIS - Les cours en ligne de l'UT2J
Cours: UOH / Statistique et Psychométrie en L1
Livre: Tri à plat et tri croisé
Imprimé par: Visiteur anonyme
Date: dimanche 24 novembre 2024, 03:20

Description

Objectifs : Définir la notion de tri à plat et montrer comment on peut le réaliser en pratique.

Prérequis :

rédaction : Éric Raufaste 

Table des matières

Le tri à plat

1. Définition

Le tri à plat est une opération consistant à déterminer comment les observations se répartissent sur les différentes modalités que peut prendre une variable à modalités discrètes.

Le résultat de cette opération est donc un simple tableau, de «  tableau de fréquences ». Ce tableau peut faire apparaître simplement le nombre d'individus dans chaque modalité, la fréquence d'individus par modalité, ou le pourcentage.

2. Quelques exemples

Soit une variable classique, le sexe. Elle a deux modalités, homme et femme. Le tri à plat des données selon cette variable consistera donc simplement à compter combien d'observations tombent dans la catégorie Homme et combien tombent dans la catégorie femme. Par exemple, 52 hommes, 65 femmes, ou encore 44,4% d'hommes pour  55,6% de femmes.

Il faut noter que si l'on inscrit le pourcentage seul, il manque une idée de l'effectif concerné et il faut au moins indiquer l'effectif total sur lequel est calculé le pourcentage. Réciproquement, le nombre d'individus seuls sont peu informatifs s'il s'agit ensuite de comparer la distribution de la variable considérée avec la distribution d'une autre variable.

Prenons maintenant une autre variable, l'âge, qui aurait divisé en cinq classes pour quelque bonne raison théorique, disons par exemple,

1°) moins de 20 ans;

2°) 20-29 ans;

3°) 30-39 ans ;

4°) 40-49 ans;

5°) 50 ans et plus

Le tri à plat sera donc tout simplement le fait de compter combien d'individus de l'échantillon tombent dans chacune de ces 5 classes. Il suffira alors de diviser le nombre d'individus d'une classe par l'effectif total de l'échantillon, puis de multiplier le résultat par 100 pour avoir le pourcentage d'individus tombant das cette classe.

3. Quelques remarques

Si les modalités sont purement qualitatives, comme des prénoms, ou le sexe, il n'est pas important de préserver leur ordre d'apparition lors de la présentation des résultats. Du coup, une présentation intéressante du tri à plat consiste à ordonner les modalités selon leur ordre décroissant de fréquence, autrement dit les plus peuplées d'abord.

4. Une vidéo de démonstration

Pour les étudiants intéressés et/ou disposant d'Excel, nous avons mis en place une vidéo de démonstration montrant comment faire un tri à plat automatiquement avec Excel.

Nous allons maintenant examiner ce qui se passe lorsque l'on veut considérer non plus une mais deux ou plus de deux variables.

Le tri croisé

Le tri croisé est une extension à plusieurs variables du tri à plat. 

2.1. Un exemple

Considérons par exemple deux variables X et Y (pour simplifier, mais ce que nous allons décrire s'applique de la même façon avec plus de deux variables) dotées de 2 et 3 modalités respectivement (là encore pour simplifier. Disons, par exemple, le sexe et la préférence politique, à gauche, au centre ou à droite. Ces deux variables définissent donc un produit cartésien de 6 modalités (femme à gauche, femme au centre, femme à droite, homme à gauche, homme au centre, homme à droite).

Si maintenant nous comptons comment sont peuplées ces six cases, si on y répartit les données d'un échantillon, on obtient un tri croisé.

2.2. Définition

Le tri croisé est l'opération consistant à calculer les fréquences d'individus statistiques tombant dans chacune des cases du produit cartésien de plusieurs variables.

Le résultat d'un tri croisé est ce qu'on appelle un «  tableau de contingences ».

Accessibilité

Couleur de fond

Font Face

Taille de police

1

Couleur de texte