La réponse du jeudi (24) : Un jeu de pile ou face
Publié le 09/04/2015

Vous pouvez retrouver cette question au format pdf.

Question du jeudi #24 : Alice lance une pièce équilibrée de façon répétée, jusqu'à obtenir un « pile » suivi d'un « face ». Bob, quant à lui, procède de même jusqu'à obtenir deux « pile » consécutifs. En moyenne, qui attendra le plus longtemps ?


C'est Bob qui attendra le plus longtemps en moyenne : intuitivement, Alice et Bob devront tous les deux obtenir un premier « pile » avant d'espérer gagner. S'ils obtiennent juste après le résultat souhaité (« face » pour Alice, « pile » pour Bob), ils ont gagné et le jeu s'arrête. Mais la symétrie ne va pas plus loin : si le lancer suivant leur est défavorable (« pile » pour Alice, « face » pour Bob), Bob est en quelque sorte revenu à la case départ, c'est-à-dire qu'il doit à nouveau obtenir un premier pile avant de pouvoir espérer gagner alors qu'Alice a encore son premier « pile », et n'a plus qu'à attendre un « face ».

Le calcul va confirmer cette intuition.

Temps d'attente moyen pour Alice

On peut réinterpréter l'expérience (pour Alice) comme un parcours dans le graphe suivant :



Alice part du sommet bleu. À chaque coup, suivant le résultat du lancer de sa pièce, elle emprunte une des deux flèches partant du sommet où elle se trouve. L'expérience s'arrête quand elle arrive au sommet vert.

Pour résoudre cette question, on se fixe en fait un objectif plus ambitieux : déterminer le temps moyen que va durer l'expérience pour tous les sommets de départ possibles pour Alice. Puisqu'évidemment l'expérience s'arrête immédiatement si Alice part directement du sommet vert, il y a en fait deux temps moyens à déterminer : le temps moyen $T$ si l'on part du sommet bleu (qui est donc le temps que nous voulons vraiment déterminer) et le temps moyen $T'$ si l'on part du sommet vert.


On obtient alors des relations entre ces différents temps :

  • Si l'on part du sommet bleu, on sera au coup suivant sur le sommet bleu (avec probabilité $1/2$) ou sur le sommet orange (avec probabilité $1/2$). Dans le premier cas, on est revenu au point de départ : on va encore attendre $T$ en moyenne. Dans le second, on va encore devoir attendre $T'$. Ainsi, le temps d'attente moyen $T$ est la moyenne de $T$ et $T'$, à laquelle on ajoute $1$ (pour prendre en compte le coup qui nous amène au sommet suivant). En formules :
    \[ T = 1 + \frac{T + T'}2.\]
  • On peut tenir le même raisonnement si l'on part du sommet orange. Avec probabilité $1/2$, on se trouvera au coup suivant encore au sommet orange (auquel cas il faudra encore attendre $T'$ en moyenne) et avec probabilité $1/2$ on se trouvera au sommet vert (auquel cas l'expérience sera terminée). On a donc
    \[ T' = 1 + \frac{T' + 0}2.\]

Cette dernière relation donne immédiatement $T' = 2$, et la première relation devient alors $T = 2 + T/2$, ce qui donne $T = 4$.

En moyenne, Alice devra donc attendre quatre coups pour arriver au sommet vert (c'est-à-dire pour observer « pile face »).

Temps d'attente moyen pour Bob

Les mêmes arguments fonctionnent pour Bob : l'expérience se ramène à un parcours aléatoire dans le graphe suivant.

Comme pour Alice, on va déterminer les temps d'attente moyens suivant le sommet de départ.



Les mêmes arguments que pour Alice donnent deux relations entre $T$ et $T'$, et l'on peut résoudre le système d'équations pour obtenir les deux valeurs cherchées.



En moyenne, Bob devra donc attendre six coups pour arriver au sommet vert (c'est-à-dire pour observer « pile pile »).

 
 
 
 
 
Dernières publications