Variable aléatoire

Site: IRIS - Les cours en ligne de l'UT2J
Cours: UOH / Statistique et Psychométrie en L1
Livre: Variable aléatoire
Imprimé par: Visiteur anonyme
Date: jeudi 9 mai 2024, 21:35

Description

Objectifs. Introduire la notion de variable aléatoire.

Prérequis. Produit cartésien

Résumé. La notion de variable aléatoire formalise l'idée qu'un phénomène variable varie selon une certaine loi de probabilité. Pour modéliser le phénomène, on définit un ensemble Ω de résultats possibles associés à une expérience aléatoire, un ensemble A de valeurs que peut prendre le phénomène, une application de l'ensemble Ω dans l'ensemble A, qui à tout résultat possible associe une et une seule valeur dans A. Enfin, on définit une probabilité des valeurs possibles en fonction de la structure précédente. Cette structure est généralement purement théorique dans les applications en psychologie.

Contient deux animations.

rédaction : Stéphane Vautier

1. Introduction : Ω, A et P

La notion de variable aléatoire conjugue la notion de variabilité et la notion d’aléa, ou encore, de probabilité. Par exemple, est aléatoire la couleur de la boule que l’on tire dans une urne contenant 10 boules, ces boules étant identiques à ceci près que neuf sont noires et qu’une est blanche. La notion de variabilité ne doit pas être automatiquement associée avec la notion d'aléa. Un phénomène peut être variable mais prévisible ; il  suffit qu'il dépende de manière déterministe de certains paramètres connus. Ici, dans l'exemple du phénomène de variation de la couleur de la boule, le résultat du tirage est imprévisible. Cependant, on pariera volontiers sur le fait que la couleur de la boule tirée est le noir – la probabilité de la couleur noire est 9/10. On modélise le caractère aléatoire de la variabilité des résultats observés avec une loi de probabilité.

Remarque épistémologique : une loi de probabilité n'est pas un concept empirique, mais un concept mathématique. Un concept empirique est une notion dont le contenu porte sur le monde des phénomènes empiriques. Pour définir une loi de probabilité, on n'a pas besoin de se référer au monde empirique, mais seulement à un monde d'événements, qui peuvent être empiriques, mais pas nécessairement. Lorsqu'on applique le concept de loi de probabilité à des événements empiriques, on crée une interprétation du monde empirique. En tant que telle, une interprétation n'implique pas la notion de vérité. Autrement dit, on ne peut pas, en général, affirmer d'une loi de probabilité qui sert à interpréter la marche d'un certain nombre d'événements possibles qu'elle est vraie. Tout au plus est-elle plausible. Une interprétation est a priori une invention sans nécessité intrinsèque. Une découverte scientifique ne se réduit pas à une interprétation probabiliste.

La variable « couleur de la boule » définie dans l'exemple précédent suit une loi de probabilité dite de Bernoulli. Une loi de probabilité est paramétrique si la probabilité d'un événement, c'est-à-dire d'un ensemble de résultats possibles, est déterminée par une fonction à paramètres (voir par exemple la loi normale, dont les paramètres sont la moyenne et l'écart type).

La psychologie est intéressée au premier chef par la notion de variable aléatoire, car beaucoup de phénomènes qui entrent dans son champ présentent un caractère de variabilité aléatoire (ou encore probabiliste), dont la forme peut faire l'objet d'une connaissance objective. On espère ainsi qu’il est possible de connaître la manière dont est régie cette variabilité imprévisible, c’est-à-dire qu'il est possible de connaître, au moins approximativement, la loi de probabilité qui gouverne la variabilité du phénomène observé. Si l'on s'engage dans la démarche qui consiste à modéliser la loi de probabilité de cette variabilité, on doit utiliser le concept de variable aléatoire. Par exemple, la durée de vie des êtres humains est une valeur imprévisible, et on peut chercher à en modéliser la variabilité à l'aide d'une variable aléatoire.

Pour définir une variable aléatoire, on a besoin de s’appuyer sur trois notions principales :

  • l’expérience aléatoire,
  • l’application d’un ensemble de résultats possibles à un ensemble de valeurs possibles,
  • la probabilité associée aux valeurs de la variable.

Partons de l’exemple, classique en probabilité, du lancer d’un dé à six faces a , b , c , d , e , f . L’expérience aléatoire consiste à lancer le dé sur un plan horizontal. C’est ici une expérience ayant une réalité empirique, par opposition à une expérience par la pensée (qui, en tant que telle, peut avoir un sens empirique). Le résultat de l’expérience est la face supérieure du dé immobilisé sur le plan. L’ensemble des résultats possibles, que l'on note Ω, est constitué des faces du dé.

Selon l’application qu’on envisage d'associer à cette expérience aléatoire, nous pouvons définir plusieurs variables aléatoires. On peut s’intéresser à l’étiquette de la face supérieure du dé immobilisé, et on pourra définir la variable aléatoire qui, à tout résultat possible du lancer de dé, associe une et une seule étiquette – on aura défini une variable aléatoire qualitative , la variable "valeur de l'étiquette". On peut aussi convenir d’associer à tout résultat possible du lancer de dé une et une seule valeur numérique, par exemple un nombre entier de 1 à 6 – on aura défini une variable numérique, la variable "numéro".

On note Ω l'ensemble des résultats possibles, A l'ensemble des valeurs possibles associées à ces résultats, et P la probabilité associée à toute valeur de la variable aléatoire. Ainsi, la variable X "valeur de l'étiquette" définie précédemment est associée à :

  • l'expérience du lancer de dé,
  • une application de Ω dans A, A = {a, b, c, d, e, f},
  • la probabilité P(X=i)=1/6, avec i = a, b, ..., f.

La variable Y "numéro" est équivalente à la variable X, à ceci près que l'ensemble des valeurs est cette fois un ensemble d'entiers.

2. Exemple 1 : le choix du film au cinéma

Le choix du film par les spectateurs lorsqu'ils achètent leur billet de cinéma est typiquement un phénomène variable. Du point de vue du spectateur, ce choix est certainement prévisible, puisqu'il obéit à un processus de décision dont on pourrait tenter de faire l'analyse psychologique. Du point de vue du gérant du cinéma, lorsqu'un spectateur quelconque se présente au guichet du cinéma ou achète son billet par internet, le choix du film est un événement imprévisible. Cependant, on sait que certains films "marchent" mieux que d'autres. On peut alors être intéressé par la modélisation du phénomène à l'aide d'une variable aléatoire "choix du film".

On définit l'ensemble Ω comme un ensemble produit cartésien de deux ensembles :

  • l'ensemble U des spectateurs qui vont au cinéma,
  • l'ensemble C des films disponibles ; on suppose, pour illustrer, que C contient cinq films.

Le produit cartésien Ω = U×C est l'ensemble de tous les couples de la forme (un spectateur, un film), c'est-à-dire de tous les résultats possibles : une personne donnée choisissant un film donné.

On définit ici l'ensemble Films comme l'ensemble des titres des films : Films = {A, B, C, D, E}, avec

  • A = Le bon, la brute et le cinglé,
  • B = Mesrine : l'instinct de mort,
  • C = L'échange,
  • D = The visitor,
  • E = Séraphine.

L'application de Ω = U×C dans Films associe à tout couple de Ω un et un seul titre de film de manière appropriée.

L'expérience aléatoire est une expérience par la pensée, qui consiste à considérer que la réalisation d'un résultat, à savoir un couple particulier de Ω, est le résultat d'un tirage au sort dans une urne dont la composition est inconnue. Comme la composition de l'urne est inconnue, la probabilité associée à la variable "choix du film" est inconnue. On peut estimer cette probabilité à partir des fréquences observées.

L'animation ci-dessous simule le choix des films par des spectateurs inconnus à l'aide d'une variable aléatoire, telle que P(A) = 0.6, P(B) = 0.1, P(C) = 0.2, P(D) = .08, P(E) = 0.02. Pour simuler l'achat d'un billet de cinéma, il suffit de cliquer sur le bouton "Tracer".

3. Exemple 2 : les scores de QI

Le score que l'on observe lorsqu'on fait passer un test d'intelligence à une personne est un phénomène variable. On peut modéliser la variabilité de ce phénomène à l'aide d'une variable aléatoire.

L'ensemble Ω des résultats possibles est le produit cartésien de deux ensembles :

  • l'ensemble U des personnes susceptibles de passer le test,
  • l'ensemble C des patterns de comportement observables avec le test.

On définit ensuite l'ensemble A des valeurs de la variable QI, à savoir les scores de QI, et l'application qui, à tout couple (personne, comportement), associe un score. Cette application repose sur des règles d'échelonnement qui attribuent aux comportements des valeurs numériques ou scores bruts, ainsi que sur des règles dites d'étalonnage, qui permettent d'attribuer un score sur l'échelle des scores de QI aux scores bruts.

L'expérience aléatoire est une expérience par la pensée. Elle consiste à tirer au sort dans une urne imaginaire des couples (personne, comportement). La composition de l'urne est bien entendu inconnue. On peut estimer la probabilité des valeurs de la variable "QI" à partir des fréquences observées.

L'animation ci-dessous simule l'observation du phénomène "QI" à partir d'une population composée de trois personnes. Il suffit pour obtenir un QI de cliquer sur le bouton "Tirage au sort".

4. Pour aller plus loin

La définition complète d'une variable aléatoire repose sur la notion d'espace de probabilités. Une présentation des notions nécessaires est donnée dans le chapitre 8, intitulé "Les probabilités", de l'ouvrage de Louise Martin et Gérald Baillargeon (1989).