Variable aléatoire

Objectifs. Introduire la notion de variable aléatoire.

Prérequis. Produit cartésien

Résumé. La notion de variable aléatoire formalise l'idée qu'un phénomène variable varie selon une certaine loi de probabilité. Pour modéliser le phénomène, on définit un ensemble Ω de résultats possibles associés à une expérience aléatoire, un ensemble A de valeurs que peut prendre le phénomène, une application de l'ensemble Ω dans l'ensemble A, qui à tout résultat possible associe une et une seule valeur dans A. Enfin, on définit une probabilité des valeurs possibles en fonction de la structure précédente. Cette structure est généralement purement théorique dans les applications en psychologie.

Contient deux animations.

rédaction : Stéphane Vautier

1. Introduction : Ω, A et P

La notion de variable aléatoire conjugue la notion de variabilité et la notion d’aléa, ou encore, de probabilité. Par exemple, est aléatoire la couleur de la boule que l’on tire dans une urne contenant 10 boules, ces boules étant identiques à ceci près que neuf sont noires et qu’une est blanche. La notion de variabilité ne doit pas être automatiquement associée avec la notion d'aléa. Un phénomène peut être variable mais prévisible ; il  suffit qu'il dépende de manière déterministe de certains paramètres connus. Ici, dans l'exemple du phénomène de variation de la couleur de la boule, le résultat du tirage est imprévisible. Cependant, on pariera volontiers sur le fait que la couleur de la boule tirée est le noir – la probabilité de la couleur noire est 9/10. On modélise le caractère aléatoire de la variabilité des résultats observés avec une loi de probabilité.

Remarque épistémologique : une loi de probabilité n'est pas un concept empirique, mais un concept mathématique. Un concept empirique est une notion dont le contenu porte sur le monde des phénomènes empiriques. Pour définir une loi de probabilité, on n'a pas besoin de se référer au monde empirique, mais seulement à un monde d'événements, qui peuvent être empiriques, mais pas nécessairement. Lorsqu'on applique le concept de loi de probabilité à des événements empiriques, on crée une interprétation du monde empirique. En tant que telle, une interprétation n'implique pas la notion de vérité. Autrement dit, on ne peut pas, en général, affirmer d'une loi de probabilité qui sert à interpréter la marche d'un certain nombre d'événements possibles qu'elle est vraie. Tout au plus est-elle plausible. Une interprétation est a priori une invention sans nécessité intrinsèque. Une découverte scientifique ne se réduit pas à une interprétation probabiliste.

La variable « couleur de la boule » définie dans l'exemple précédent suit une loi de probabilité dite de Bernoulli. Une loi de probabilité est paramétrique si la probabilité d'un événement, c'est-à-dire d'un ensemble de résultats possibles, est déterminée par une fonction à paramètres (voir par exemple la loi normale, dont les paramètres sont la moyenne et l'écart type).

La psychologie est intéressée au premier chef par la notion de variable aléatoire, car beaucoup de phénomènes qui entrent dans son champ présentent un caractère de variabilité aléatoire (ou encore probabiliste), dont la forme peut faire l'objet d'une connaissance objective. On espère ainsi qu’il est possible de connaître la manière dont est régie cette variabilité imprévisible, c’est-à-dire qu'il est possible de connaître, au moins approximativement, la loi de probabilité qui gouverne la variabilité du phénomène observé. Si l'on s'engage dans la démarche qui consiste à modéliser la loi de probabilité de cette variabilité, on doit utiliser le concept de variable aléatoire. Par exemple, la durée de vie des êtres humains est une valeur imprévisible, et on peut chercher à en modéliser la variabilité à l'aide d'une variable aléatoire.

Pour définir une variable aléatoire, on a besoin de s’appuyer sur trois notions principales :

  • l’expérience aléatoire,
  • l’application d’un ensemble de résultats possibles à un ensemble de valeurs possibles,
  • la probabilité associée aux valeurs de la variable.

Partons de l’exemple, classique en probabilité, du lancer d’un dé à six faces a , b , c , d , e , f . L’expérience aléatoire consiste à lancer le dé sur un plan horizontal. C’est ici une expérience ayant une réalité empirique, par opposition à une expérience par la pensée (qui, en tant que telle, peut avoir un sens empirique). Le résultat de l’expérience est la face supérieure du dé immobilisé sur le plan. L’ensemble des résultats possibles, que l'on note Ω, est constitué des faces du dé.

Selon l’application qu’on envisage d'associer à cette expérience aléatoire, nous pouvons définir plusieurs variables aléatoires. On peut s’intéresser à l’étiquette de la face supérieure du dé immobilisé, et on pourra définir la variable aléatoire qui, à tout résultat possible du lancer de dé, associe une et une seule étiquette – on aura défini une variable aléatoire qualitative , la variable "valeur de l'étiquette". On peut aussi convenir d’associer à tout résultat possible du lancer de dé une et une seule valeur numérique, par exemple un nombre entier de 1 à 6 – on aura défini une variable numérique, la variable "numéro".

On note Ω l'ensemble des résultats possibles, A l'ensemble des valeurs possibles associées à ces résultats, et P la probabilité associée à toute valeur de la variable aléatoire. Ainsi, la variable X "valeur de l'étiquette" définie précédemment est associée à :

  • l'expérience du lancer de dé,
  • une application de Ω dans A, A = {a, b, c, d, e, f},
  • la probabilité P(X=i)=1/6, avec i = a, b, ..., f.

La variable Y "numéro" est équivalente à la variable X, à ceci près que l'ensemble des valeurs est cette fois un ensemble d'entiers.