Peut-on imiter le hasard ?


Depuis que statistique et probabilités ont pris une large place dans les programmes de mathématiques, on nous propose souvent de petites expériences pour tester notre perception du hasard. Mais cela se termine généralement par l'énoncé d'une propriété sans démonstration, ce qui peut laisser penser qu'il n'en existe pas de preuve élémentaire.
J'ai choisi de présenter ici une de ces situations et d'en proposer une démonstration utilisant le cours de spécialité de terminale ES, en particulier les graphes.

A - L'expérience

Demandez à quelques personnes de lancer cent fois une pièce de monnaie et de noter la suite des résultats des cent lancers en indiquant P pour pile et F pour face.
Evidemment, elles peuvent remplacer la pièce par un dé (en général plus facile à lancer qu'une pièce) et noter P lorsque le résultat est pair et F lorsque le résultat est impair.

Demandez à quelques autres personnes de noter une suite inventée de cent P ou F imitant les résultats de cent lancers de pièce.

Comparez ensuite les résultats des deux groupes...

Recherchez dans chaque suite la séquence la plus longue, c'est à dire le nombre maximum de résultats identiques qui se suivent, et notez sa longueur.

Par exemple, dans

F F P F F F F P F P P F P F P P P F F P F P F F P P P P F F P F F F F P P P F F F P F F P F P P F F P F F P P F F F P F F F F F F F F F F F P P P F F P P P F P P F P P P P P F F P F P F F P F F F P F,
la plus longue séquence est F F F F F F F F F F F. Sa longueur est 11.


Vous constaterez que dans le groupe qui a imité le hasard, les séquences maximales sont en général nettement plus courtes que dans le groupe qui a réellement fait l'expérience (à condition bien sûr que les imitateurs ne soient pas des statisticiens qu'on ne piège pas aussi facilement !)

On peut même adopter le critère suivant pour distinguer une suite expérimentale d'une suite inventée : s'il n'y a pas de séquence de longueur au moins 6, on se trompe peu en décidant que la suite est inventée (surtout si elle n'a pas non plus de séquence de longueur 5) et s'il y a une séquence de longueur 6 ou plus, on peut penser que la suite est expérimentale.

Les imitateurs ont une mauvaise intuition du hasard : ils imaginent qu'une suite au hasard distribue assez régulièrement les piles et les faces, ils n'osent donc pas mettre 6 résultats identiques consécutifs.

Nous allons voir que la probabilité d'avoir une séquence de longueur au moins 6 dans une suite de cent lancers de pièce au hasard est d'environ 81 %, et que la probabilité d'avoir une séquence de longueur au moins 5 est d'environ 97 %...

B - Une démonstration

Pour modéliser cela, considérons six états possibles d'une suite de n lancers de pièce :
- Etat A : elle ne contient pas de séquence de longueur au moins 6 et finit par une séquence de longueur 1

- Etat B :
elle ne contient pas de séquence de longueur au moins 6 et finit par une séquence de longueur 2
- Etat C : elle ne contient pas de séquence de longueur au moins 6 et finit par une séquence de longueur 3
- Etat D :
elle ne contient pas de séquence de longueur au moins 6 et finit par une séquence de longueur 4
- Etat E :
elle ne contient pas de séquence de longueur au moins 6 et finit par une séquence de longueur 5
- Etat F : elle contient une séquence de longueur au moins 6.
Ces six états forment une partition de l'ensemble des situations possibles pour cette suite.

Les changements d'états lorsqu'on relance la pièce pour passer d'une suite de n lancers à une suite de n+1 lancers peuvent alors être résumés par le graphe probabiliste suivant :

Par exemple, lorsqu'une suite est à l'état C, elle finit par une séquence de longueur 3.
Lorsqu'on relance la pièce, elle tombe ou bien du même côté que dans cette séquence avec une probabilité 1/2 et passe à l'état D, ou bien du côté opposé avec une probabilité 1/2 et repasse à l'état A.

La matrice de transition d'une suite de n lancers à une suite de n+1 lancers est donc :

   
A
B
C
D
E
F
A
0.5
0.5
0
0
0
0
B
0.5
0
0.5
0
0
0
C
0.5
0
0
0.5
0
0
D
0.5
0
0
0
0.5
0
E
0.5
0
0
0
0
0.5
F
0
0
0
0
0
1

Posons M =

Notons an, bn, cn, dn, en, fn les probabilités respectives qu'une suite de lancers soit à l'état A, B, C, D, E, F après n lancers.

On a donc :
(an+1, bn+1, cn+1, dn+1, en+1, fn+1) = (an, bn, cn, dn, en, fn) x M

D'où :
(an, bn, cn, dn, en, fn) = (a1, b1, c1, d1, e1, f1) x M n-1
Or après un lancer, la suite est toujours à l'état A. Donc a1 = 1 et b1 = c1 = d1 = e1 = f1 = 0.

On en déduit :
(an, bn, cn, dn, en, fn) = (1, 0, 0, 0, 0, 0) x M n-1

En particulier :
(a100, b100, c100, d100, e100, f100) = (1, 0, 0, 0, 0, 0) x M 99

Le calcul avec une calculatrice donne :

(a100, b100, c100, d100, e100, f100)

(1, 0, 0, 0, 0, 0)
x

On en déduit : f100 0,806

Cela signifie que la probabilité de trouver une séquence de longueur au moins 6 dans une suite de 100 lancers est environ égale à 81 %.

Un raisonnement analogue montre que la probabilité de trouver une séquence de longueur au moins 5 dans une suite de 100 lancers est environ égale à 97 % car



Le calcul fournit les résultats suivants pour une suite de 100 lancers :

longueur de la séquence
4
5
6
7
8
9
10
11
12
probabilité arrondie au centième
1,00
0,97
0,81
0,54
0,31
0,17
0,09
0,04
0,02

Ces valeurs donnent le graphique ci-dessous :

On voit que la forte probabilité de certains événements est peu intuitive.

On se rend ainsi compte qu'il n'est pas du tout évident pour un être humain d’imiter le hasard.