Fréquence conditionnelle
Site: | IRIS - Les cours en ligne de l'UT2J |
Course: | UOH / Statistique et Psychométrie en L2 |
Book: | Fréquence conditionnelle |
Printed by: | Guest user |
Date: | Saturday, 18 January 2025, 6:15 AM |
Description
Objectifs. Définir la notion de fréquence conditionnelle.
Prérequis.
Résumé. La notion de fréquence conditionnelle repose sur la donnée d'un couple de variables discrètes (X, Y). La fréquence d'une certaine valeur yj en Y conditionnellement à une certaine valeur xi en X est la proportion des cas de la classe xi qui ont pour valeur yj .
1. Approche intuitive
Considérons les 1395 étudiants qui se sont inscrits en première année de psychologie une certaine année dans une université. Ces étudiants sont décrits de deux points de vue : ils se sont présentés aux examens ou pas, ils ont obtenu ou pas leur première année de licence. Le taux de réussite est la proportion des étudiants qui ont obtenu leur première année. Pour améliorer la communication, on peut cependant préférer présenter le taux de réussite du groupe des étudiants qui se sont effectivement présentés aux examens. Il s'agit alors d'un taux de réussite conditionnel, c'est-à-dire qu'on calcule ce taux dans un sous-groupe.Voici les données :
Réussite | Échec | Total | |
---|---|---|---|
Présents | 454 | 132 | 586 |
Absents | 0 | 809 | 809 |
Total | 454 | 941 | 1395 |
Remarque : dans les articles sur le risque et les facteurs de risque et sur la prévision scientifique et actuarielle, nous insistons sur le fait qu'il est erroné d'interpréter les statistiques inter-individuelles de manière causale. On voit bien qu'il ne suffirait pas de se présenter aux examens pour avoir 77% de chance d'obtenir son année...
2. Couple de variables et notations
Le couple de variables ( X , Y ) est une application d'un ensemble d'êtres, ensemble noté généralement Ω, dans un ensemble d'objets qui sont des couples de valeurs descriptives. Cet ensemble est le produit cartésien de l'ensemble M( X ) des valeurs descriptives de la variable X et de l'ensemble M( Y ) des valeurs descriptives de la variable Y . Cet ensemble, qui s'appelle un référentiel de description (https://iris.univ-tlse2.fr/course/view.php?id=7873#section-5) est
M( X ) × M( Y ) = { x 1 , x 2 , ..., xi , ..., xp } × { y 1 , y 2 , ..., yj , ..., yq } = {( x 1 , y 1 ), ( x 1 , y 2 ), ..., ( x i , yj ), ..., ( xp , yq )}.
Les éléments du référentiel de description sont des objets conceptuels (des états). Ces objets se répartissent dans le tableau à double entrée associée au couple ( X , Y ) suivant :
y 1 |
y
2
|
...
|
y i | ... |
y
q
|
|
x 1 | ( x 1 , y 1 ) | ( x 1 , y 2 ) |
(
x
1
,
yj
)
|
(
x
1
,
yq
)
|
||
x 2 | ( x 2 , y 1 ) | ( x 2 , y 2 ) | ( x 2 , yj ) |
(
x
2
,
yq
)
|
||
... |
|
|||||
xi
|
( xi , y 1 ) |
(
xi
,
y
2
)
|
( x i , yj ) | ( xi , yq ) | ||
... | ||||||
xp
|
( x p , y 1 ) |
(
x
p
,
y
2
)
|
(
x
p
,
yj
)
|
( x p , yq ) |
Explicitons les symboles utilisés dans ces notations :
- Les lettres x et y désignent des valeurs descriptives. Elles sont en minuscule pour ne pas confondre avec les lettres majuscules X et Y qui désignent des variables. Les valeurs descriptives sont numérotées. Ainsi, la variable X possède p valeurs, numérotées de 1 à p ; la lettre i indique la i ème valeur. Ces numéros sont ajoutés en indice de la lettre x , ce qui permet de désigner n'importe quelle valeur particulière de la variable X. Même raisonnement pour les lettres y de la variable Y qui possède q valeurs.
- Un couple est un ensemble ordonné : (X , Y) n'est pas la même chose que (Y , X) alors que {X , Y} = {Y , X}. On convient de ce que les lignes sont toujours réservées à la première variable du couple, et de ce que les colonnes sont toujours réservées à la seconde variable du couple (truc mnémotechnique : Li-Co pour ligne puis colonne).
- Les nombres ne sont jamais en italique. Les lettres sont en italique sauf exception cosmétique (par exemple Ω).
La table de contingence associée à (X , Y) est le même tableau, à la différence que les cellules du tableau contiennent le nombre des états -- ou objets -- (x , y) observés. Voici les notations associées :
y 1 |
y
2
|
...
|
y i | ... |
y
q
|
||
x 1 | n 11 | n 12 | n 1 j | n 1 q | n 1 • | ||
x 2 | n 21 | n 22 | n 2 j |
n
1
q
|
n 2 • | ||
... |
|
||||||
xi
|
n i 1 | n i 2 | nij | niq | n i • | ||
... | |||||||
xp
|
n p 1 |
n
p
2
|
n
p
j
|
n p q | np • | ||
n • 1 |
n
•
2
|
n
•
j
|
n
•
q
|
n
|
Par exemple, la notation n 12 désigne le nombre de fois où l'état (x1 , y2) a été observé dans Ω. C'est un effectif conjoint. La dernière ligne et la dernière colonne indiquent les effectifs marginaux. Par exemple, la notation n1 • indique le nombre de cas se trouvant dans l'état x1 ; le point qui suit l'indice 1 indique qu'on ne se soucie pas des valeurs prises par ces cas en Y.
3. Fréquence conditionnelle
On note fq( xi | yj ) la fréquence de l'événement xi conditionnellement à l'événement yj et on lit "fréquence de x i sachant yj ". Par définition, fq( xi | yj ) = nij /n • j : on divise le nombre de cas dans l'état conjoint ( xi , yj ) par le nombre de cas dans l'état yj . De même, fq( yj | xi ) = nij /n i• : on divise le nombre de cas dans l'état conjoint ( xi , yj ) par le nombre de cas dans l'état x i .
Background Colour
Font Face
Font Size
Text Colour