Nicolas Eber
LARGE, Université Robert Schuman – Strasbourg 3
nicolas.eber@urs.u-strasbg.fr
Un très beau jeu, appelé « concours de beauté » pour des raisons évoquées un peu plus bas, permet de discuter, de manière particulièrement fine, des limites de l’hypothèse de rationalité des individus si souvent utilisée en sciences sociales, notamment en économie.
SOMMAIRE
Descriptif du jeu
Les résultats expérimentaux
La solution théorique
Le décalage entre résultats expériemantux et solution théorique
Pourquoi "concours de beauté"?
Quelques exercices simples
Quelques résultats complémentaires
Annexes
Bibliographie
Notes
Retour au sommaire des "Jeux mathématiques appliqués auxsciences sociales "
Le jeu concerne tous les élèves de la classe. Chaque élève doit se munir d’un bout de papier et doit écrire un nombre entre 0 et 100. Le vainqueur du jeu, qui gagne éventuellement un prix annoncé à l’avance[1], est l’élève ayant écrit le nombre le plus proche de la moitié de la moyenne de tous les nombres choisis[2]. Autrement dit, l’enseignant collecte tous les nombres annoncés, en calcule la moyenne et déclare vainqueur l’élève ayant annoncé le nombre le plus proche de la moitié de cette moyenne. Le jeu est généralement répété quatre fois[3].
Lors de la première période, la moyenne des nombres annoncés se situe généralement entre 25 et 35, le nombre vainqueur étant, par conséquent, le plus souvent compris entre 12 et 18. Lors des périodes suivantes, la moyenne (ainsi que le nombre vainqueur) diminue et se rapproche de 0 (la solution théorique du jeu, comme nous l’expliquons plus bas).
Voici, à titre d’exemple, les résultats obtenus par Nagel [1995] :
Période Moyenne Classe n° 1 Moyenne Classe n° 2 Moyenne Classe n° 3 Moyenne globale 1 23,7 33,2 24,2 27,0 2 10,9 12,1 10,2 11,1 3 5,3 3,8 2,4 3,8 4 8,1 13,0 0,4 7,2Source : Nagel [1995, Tableau 1-A, p. 1321].
Quelle est la solution « logique » de ce jeu? En économie, la solution logique renvoie au concept d’équilibre de Nash[4]. Un équilibre de Nash se définit comme un ensemble de stratégies (une par joueur) tel qu’aucun des protagonistes ne peut améliorer sa propre situation compte tenu des stratégies adoptées par les autres. Il s’agit d’un critère de « stabilité stratégique » qui implique l’absence généralisée de regret : à l’équilibre de Nash, aucun joueur n’a de regret étant donné ce qu’ont fait les autres joueurs.
Le jeu que nous considérons n’admet qu’un seul équilibre de Nash, dans lequel tous les joueurs annoncent 0. Expliquons intuitivement pourquoi. Supposons qu’a priori, les joueurs choisissent au hasard un nombre compris entre 0 et 100 ; leur idée première sera sans doute de jouer 50, c’est-à-dire le nombre « moyen » provenant de l’intervalle [0, 100]. Maintenant, chaque joueur doit comprendre que si tous ses adversaires jouent effectivement 50, 50 est une stratégie dominée puisque le nombre vainqueur sera 50/2 = 25 : considérant que tous les autres joueurs annoncent 50, chaque joueur a intérêt à changer de stratégie et à jouer 25. Tous les joueurs rationnels doivent théoriquement faire ce raisonnement qui les amène tous à préférer 25 à 50. Mais, si tous les joueurs jouent 25, chaque joueur doit comprendre que 25 devient à son tour une stratégie dominée (puisque le nombre vainqueur est maintenant 25/2 = 12,5) et a donc intérêt à changer unilatéralement de stratégie en jouant 12,5. Tous les joueurs rationnels faisant normalement ce raisonnement, chacun aura tendance à passer de 25 à 12,5. De nouveau, si tous les joueurs choisissent 12,5, ce nombre devient une stratégie dominée et chaque joueur a intérêt à changer unilatéralement de stratégie et à opter pour le nombre vainqueur, c’est-à-dire 12,5/2 = 6,25. De proche en proche, on peut ainsi éliminer de manière itérative les stratégies dominées (« méthode de la dominance itérée ») et montrer que la seule situation « stable », c’est-à-dire dans laquelle aucun des joueurs n’a plus intérêt à changer unilatéralement de stratégie, correspond à une annonce de 0 de la part de tous les joueurs. Vérifions rapidement que cette situation constitue bien un équilibre de Nash, c’est-à-dire une situation telle qu’aucun des joueurs n’a intérêt à changer unilatéralement de stratégie. Si tous les joueurs annoncent 0, la moyenne des annonces est 0 et le nombre vainqueur est donc 0/2 = 0, tous les joueurs se partageant le prix. Un joueur peut-t-il alors avoir intérêt à changer unilatéralement de stratégie, c’est-à-dire à ne plus jouer 0 alors que les autres continuent à le faire ? Prenons un exemple simple. Supposons qu’il y ait 10 joueurs. Sachant que 9 joueurs jouent 0, le 10 ème joueur a-t-il intérêt à annoncer un nombre positif, par exemple 1 ? S’il joue 1, la moyenne de toutes les annonces devient (9x0 + 1x1) / 10 = 0,1 et le nombre vainqueur est donc 0,1 / 2 = 0,05. Clairement, 0 est plus proche du nombre vainqueur que 1 ; autrement dit, ce sont les joueurs ayant annoncé 0 qui remportent le jeu et se partagent le prix alors que le joueur ayant « dévié » en jouant 1 est le seul perdant (c’est-à-dire le seul à ne pas recevoir une partie du prix). Aucun joueur n’a donc intérêt à changer unilatéralement de stratégie dans la situation où tout le monde annonce 0 : une annonce de 0 par tous les joueurs est bien le seul équilibre de Nash du jeu[5].
Dans ce jeu, l’application de la méthode de la dominance itérée devrait conduire tous les joueurs à annoncer 0 et, par conséquent, à se partager le prix puisqu’en faisant la même annonce, ils sont tous à égalité. Or, les résultats expérimentaux montrent que la moyenne des annonces se situe généralement aux alentours de 30 et qu’il y a bien souvent un seul vainqueur. Ainsi, on observe un écart particulièrement frappant entre la solution théorique du jeu et la manière dont les élèves se comportent effectivement. L’explication est très simple. Elle tient au fait que les joueurs n’appliquent pas la méthode de la dominance itérée jusqu’au bout. Plus précisément, leurs capacités cognitives les limitent le plus souvent à une, deux ou trois étapes dans l’application qu’ils font de la méthode. Il est fondamental de rajouter qu’ici, un joueur parfaitement rationnel, c’est-à-dire capable d’un raisonnement par dominance itérée infini, n’a pas intérêt à appliquer ce raisonnement « ultra-sophistiqué ». En effet, son problème est de bien évaluer la capacité de raisonnement moyenne des autres joueurs afin de prédire correctement leurs choix et de remporter le jeu. Autrement dit, le problème est d’être un niveau de raisonnement plus loin que le joueur moyen, mais surtout pas davantage. Ce qui compte finalement, ce n’est pas tant la compréhension individuelle que le sujet peut avoir du jeu, mais plutôt l’introspection qu’il réalise à propos du comportement des autres joueurs.
Pourquoi ce jeu est-il souvent appelé « jeu du concours de beauté » ? Ce nom vient du fait qu’il ressemble beaucoup au fameux « concours de beauté » cher à John Maynard Keynes. Keynes suggère, dans la Théorie Générale, que le comportement des investisseurs sur les marchés financiers peut être mis en parallèle avec les concours de beauté organisés par les journaux de l’époque, dans lesquels les lecteurs devaient élire les 6 plus beaux visages parmi 100 portraits. Le vainqueur était la personne dont les préférences étaient les plus proches des préférences moyennes de tous les participants. Keynes expliquait alors que les lecteurs du journal, comme les investisseurs financiers, ne doivent pas choisir les visages (placements) qu’ils trouvent personnellement les plus attirants, mais doivent plutôt être guidés par leurs anticipations sur les préférences des autres[6]. Selon Keynes, c’est cette règle de décision qui caractérise les comportements sur les marchés financiers. En effet, sur le marché des actions, le but est de vendre ses actions lorsque les cours sont au plus haut, donc juste avant que les autres investisseurs ne décident de vendre (et fassent ainsi baisser le prix). Cette attente du moment opportun pour vendre, partagée par tous les investisseurs, peut expliquer non seulement la possible persistance de bulles spéculatives sur les marchés boursiers (chaque opérateur attend, pensant que tous les autres vont également continuer d’attendre…), mais également la fragilité de ces bulles (il peut suffire qu’un seul opérateur donne le signal en vendant ses titres pour que tous les autres le suivent, faisant ainsi « éclater » la bulle). D’un point de vue général, on peut donc dire que le détenteur d’actions fait bien face à un problème du même type que le joueur du « concours de beauté » : il doit anticiper le comportement (et les anticipations) des autres joueurs pour déterminer sa propre stratégie. Ainsi, le jeu du concours de beauté apparaît comme un moyen très simple et très intuitif d’introduire une discussion sur les marchés financiers, les bulles spéculatives, etc.
On peut demander aux élèves de considérer la version générale du jeu où les joueurs doivent être le plus proche de p fois la moyenne des annonces (p=½ dans la version étudiée plus haut). On peut leur demander de démontrer que le seul équilibre correspond à une annonce de 0 par tous les joueurs pour tout p appartenant à l'intervallle ]0,1[.
On peut ensuite les amener à remarquer que le jeu envisagé par Keynes correspond en fait au cas où p=1 puisqu’il s’agit d’être le plus proche possible de la moyenne des participants. On peut alors leur demander de démontrer que, lorsque p=1, toute situation dans laquelle tous les participants annoncent le même nombre constitue un équilibre de Nash. On peut également leur demander d’envisager ce qui se passe lorsque p>1.
Le jeu du concours de beauté est mentionné par Hervé Moulin [1986]. Il a été repris et expérimenté par Rosemarie Nagel [1995]. Il a fait l’objet de très nombreuses expériences depuis dix ans. Nagel [2006] propose une synthèse des résultats expérimentaux provenant de ce jeu. On peut en noter trois particulièrement importants :
Annexe 1 : Descriptif de l’expérience
Annexe 2 : Instructions
Prenez un petit bout de papier. Choisissez un nombre entre 0 et 100 et inscrivez-le sur le bout de papier. Le vainqueur sera l’élève dont le nombre est le plus proche de la moitié de la moyenne de tous les nombres choisis. Autrement dit, je vais collecter les nombres inscrits sur les bouts de papier et en calculer la moyenne ; l’élève le plus proche de la moitié de cette moyenne aura gagné. Le vainqueur recevra une récompense[8]. S’il y a des ex æquo, le prix est partagé équitablement entre eux.
Le jeu est répété 4 fois (4 périodes).
Keynes J.M. [1936], The General Theory of Employment, Interest and Money, MacMillan. [Traduction française 1969, Théorie générale de l’emploi, de l’intérêt et de la monnaie, Payot.]
Moulin H. [1986], Game Theory for Social Sciences, New York Press.
Nagel R. [1995], « Unraveling in Guessing Games: An Experimental Study », American Economic Review, 85, 1313-1326.
Nagel R. [2006], « Experimental Beauty-Contest Games: Levels of Reasoning and Convergence to Equilibrium », in Plott C. et Smith V. (éditeurs), Handbook of Experimental Economics Results, Elsevier, à paraître.
[1] Une tablette de chocolat fait généralement l’affaire…
[2] En cas d’égalité, le prix est partagé équitablement entre les ex æquo.
[3] Les instructions précises du jeu sont en annexe.
[4] Du nom de son inventeur, John Nash, mathématicien génial ayant sombré au début des années 1960 dans une forme grave de schizophrénie paranoïde et dont le destin hors du commun a été rendu célèbre par le film « Un homme d’exception ». Le concept d’équilibre de Nash étant devenu la pierre angulaire de la théorie des jeux et, par conséquent, de la science économique moderne, Nash s’est vu décerner, en 1994, le Prix Nobel d’économie.
[5] On peut donner une démonstration plus « formelle ». Supposons qu’il y ait un équilibre dans lequel au moins un joueur choisit un nombre positif avec une probabilité positive. Soit k le nombre le plus élevé choisi avec une probabilité positive et soit m l’un des joueurs choisissant k avec une probabilité positive. De manière évidente, à cet équilibre, ½ fois la moyenne des nombres choisis est plus petit que k. De ce fait, le joueur m peut augmenter ses chances de victoire en remplaçant k par un nombre plus petit (avec la même probabilité). Par conséquent, aucun équilibre n’existe avec un nombre positif choisi avec une probabilité positive. Il reste simplement à montrer que l’annonce de 0 par tous les joueurs est bien un équilibre de Nash. Pour cela, il suffit de constater qu’une déviation unilatérale de 0 vers un nombre k > 0 impliquerait une défaite certaine ; en effet, la moyenne des nombres choisis serait k/j (où j est le nombre de joueurs) et le vainqueur serait donc le joueur le plus proche de k/2j. Puisque j est supérieur ou égal à 2, les joueurs annonçant 0 sont plus proches de k/2j que le joueur ayant annoncé k. Ainsi, dévier de 0 fait perdre à coup sûr si tous les autres joueurs choisissent 0. L’annonce de 0 par tous les joueurs est donc bien le seul équilibre de Nash.
[6] Le passage en question de la Théorie générale de l’emploi, de l’intérêt et de la monnaie est le suivant (p. 171 de l’édition française) : « Ou encore, pour varier légèrement la métaphore, la technique du placement peut être comparée à ces concours organisés par les journaux où les participants ont à choisir les six plus jolis visages parmi une centaine de photographies, le prix étant attribué à celui dont les préférences s’approchent le plus de la sélection moyenne opérée par l’ensemble des concurrents. Chaque concurrent doit donc choisir non les visages qu’il juge lui-même les plus jolis, mais ceux qu’il estime les plus propres à obtenir le suffrage des autres concurrents, lesquels examinent tous le problème sous le même angle. Il ne s’agit pas pour chacun de choisir les visages qui, autant qu’il en peut juger, sont réellement les plus jolis ni même ceux que l’opinion moyenne considérera réellement comme tels. Au troisième degré où nous sommes déjà rendus, on emploie ses facultés à découvrir l’idée que l’opinion moyenne se fera à l’avance de son propre jugement. Et il y a des personnes, croyons-nous, qui vont jusqu’au quatrième ou au cinquième degré ou plus loin encore. ».
[7] Un traitement immédiat des réponses est possible à réaliser. Il suffit de choisir un élève ayant une calculatrice sur lui, de lui dicter l’ensemble des réponses, puis de lui faire calculer la moyenne de l’ensemble des nombres annoncés.