CultureMATH - accueil - contact

Le dilemme du prisonnier

Nicolas Eber
LARGE, Université Robert Schuman – Strasbourg 3

nicolas.eber@urs.u-strasbg.fr


Présentation par son auteur de l'ouvrage "Le dilemme du prisonnier", Editions La Découverte, collection Repères (n° 451), et quelques idées pour son utilisation dans l'enseignement.

SOMMAIRE

Qu’est-ce que le dilemme du prisonnier ?
De la théorie à l’expérience…

L’objet de l’ouvrage

Exemple d’utilisation en classe : lien avec la biologie

Retour au sommaire des "Jeux mathématiques appliqués auxsciences sociales"

Qu’est-ce que le dilemme du prisonnier ?

Bonnie et Clyde, deux criminels notoires, sont suspectés par la police d’avoir commis un vol à main armée. Ils sont arrêtés et interrogés séparément. Manquant de preuves, les policiers cherchent à les faire avouer. Pour cela, ils proposent à chacun l’arrangement suivant : « Si tu avoues avoir participé au vol tout en dénonçant ton complice et si celui-ci nie, alors nous te promettons l’immunité et tu seras libéré sur le champ alors que ton complice (coupable désigné) sera condamné à 5 ans de prison. Si c’est toi qui nies et ton complice qui avoue, c’est toi qui seras condamné à 5 ans de prison et ton complice qui sera libéré. Si vous avouez tous les deux, vous écoperez chacun de 3 ans de prison (le juge tenant compte de votre « coopération » avec les autorités). Maintenant, si vous persistez à nier, vous serez tous les deux condamnés à 1 an de prison (bénéficiant ainsi de la clémence du jury en raison d’insuffisance de preuves). »

Ce « jeu » peut être représenté par le tableau suivant :

   
Clyde
   
Avoue (A)
Nie (N)
Bonnie
Avoue (A)
3 ans de prison chacun
Bonnie : 0 an (libre)
Clyde : 5 ans
Nie (N)
Bonnie : 5 ans
Clyde : 0 an (libre)
1 an de prison chacun

Bien entendu, l’objectif de chaque prisonnier est de minimiser le nombre d’années d’emprisonnement. La stratégie d’aveu (A) est ici une stratégie dominante pour les deux protagonistes. En effet, quel que soit le choix de son complice, chaque prisonnier obtient toujours un résultat meilleur en avouant. Si Clyde choisit de nier (N), Bonnie est condamnée à 1 an de prison si elle nie alors qu’elle est libre si elle avoue. Si Clyde choisit d’avouer (A), Bonnie est condamnée à 5 ans de prison si elle nie, mais réduit sa peine à 3 ans si elle avoue également. Le jeu étant parfaitement symétrique, le même raisonnement vaut pour l’autre prisonnier. Au total, quel que soit le choix de son complice, chaque prisonnier a toujours intérêt à avouer. Ainsi, la solution logique du jeu (le seul « équilibre de Nash », dans le jargon de la théorie des jeux) est que chaque prisonnier avoue, chacun étant alors condamné à 3 ans de prison, alors qu’en « coopérant », c’est-à-dire en niant tous les deux, ils auraient écopé chacun d’une seule année d’emprisonnement.

Le dilemme du prisonnier illustre le conflit entre les incitations sociales à coopérer et les incitations privées à ne pas le faire : chaque prisonnier fait face à un dilemme entre sa rationalité individuelle qui lui dicte d’avouer et de dénoncer son complice et sa rationalité collective qui lui dicte de se taire.

Robert Axelrod a surnommé le dilemme du prisonnier « le colibacille des sciences sociales ». Ce modèle simplifié englobe en effet un très grand nombre de situations sociales puisqu’il incarne le conflit fondamental entre l’intérêt individuel et l’intérêt collectif. Suggéré par une expérience menée en 1950 par les mathématiciens de la Rand Corporation Melvin Dresher et Merrill Flood, puis explicité la même année par leur collègue Albert Tucker, le dilemme du prisonnier a fait l’objet d’un nombre vertigineux d’investigation scientifique.

Le conflit entre l’intérêt individuel et l’intérêt collectif caractéristique du dilemme du prisonnier se retrouve dans de très nombreuses situations sociales. En économie, notamment, un grand nombre de phénomènes constituent des dilemmes du prisonnier. Par exemple, deux entreprises leaders sur un marché ont souvent tendance à se livrer une concurrence sans merci (en termes de prix, de publicité, etc.) alors qu’une entente aurait permis de limiter les coûts pour chacune d’entre elles. De même, dans le domaine des relations internationales, la course aux armements est un exemple classique de dilemme du prisonnier. Deux pays se livrant à une surenchère dans les investissements militaires se retrouvent finalement dans une situation où ils se neutralisent en termes d’influence, c’est-à-dire une situation très proche de celle qui aurait pu exister si aucun pays ne s’était individuellement lancé dans l’opération. Le dopage dans le sport de haut niveau est également un bon exemple. Chaque sportif a intérêt à utiliser des produits interdits dans l’espoir d’améliorer ses performances. Le problème est que si chaque concurrent utilise la même stratégie, on se retrouve avec le même classement final, mais avec un coût potentiellement très élevé en termes de santé publique (et d’éthique).

Ainsi, le dilemme du prisonnier apparaît comme la situation la plus fréquente dans les interactions sociales. Il incarne l’idée fondamentale selon laquelle la confrontation des intérêts individuels ne débouche pas nécessairement sur l’optimum social. C’est pour cette raison qu’il est au cœur de la théorie économique, mais également d’analyses en science politique, en sociologie ou encore en anthropologie. D’une manière générale, on peut d’ailleurs considérer que c’est bien pour résoudre les situations de ce type qu’ont été mises en place un grand nombre des conventions et des institutions qui régissent aujourd’hui nos sociétés : Etat, lois, éthique, etc. C’est pourquoi le dilemme du prisonnier constitue, pour certains, la matrice fondamentale des sciences sociales, c’est-à-dire le modèle « universel » sur lequel pourrait à terme s’opérer leur unification.

 

De la théorie à l’expérience…

Le dilemme du prisonnier a été mobilisé dans un très grand nombre d’études expérimentales, tant en économie qu’en psychologie sociale. Parmi les résultats les plus spectaculaires, on peut citer les suivants :

  1. Certaines études ont montré que les femmes coopèrent davantage que les hommes.

  2. Chez des enfants âgés de 6 à 11 ans, on a observé un taux de coopération (c’est-à-dire un pourcentage de sujets optant pour la coopération) qui augmente avec l’âge, un résultat suggérant, en conformité avec certains principes de la psychologie de l’enfant, un apprentissage progressif des normes sociales de coopération.

  3. L es étudiants en économie sont moins coopératifs que les autres !

  4. Les étudiants anglo-saxons coopèrent moins que les autres.

  5. Les traits de personnalité influencent le comportement face au jeu.

  6. Les autistes ne se comportent pas différemment des sujets « normaux », mais ont une perception très différente du jeu.

  7. La communication entre les joueurs renforce la coopération.

  8. La coopération est plus forte lorsque les sujets se connaissent et partagent un esprit de groupe.

  9. L’introduction d’un mécanisme de sanction peut renforcer la coopération, même si elle a parfois des effets pervers en introduisant une suspicion entre les joueurs qui peut inhiber certains comportements coopératifs.

  10. La pression sociale (pression par les pairs) est un mécanisme incitatif à la coopération particulièrement puissant.

L’objet de l’ouvrage

L’objet du petit ouvrage intitulé « Le dilemme du prisonnier », publié dans la collection Repères aux Editions La Découverte, est de faire le point sur les développements récents autour du dilemme du prisonnier. Parmi les questions envisagées, citons :

L’objet de l’ouvrage est de présenter le dilemme du prisonnier sous ses différentes facettes en faisant un point complet sur l’état des connaissances. Cette synthèse se veut la plus large possible en intégrant les acquis de l’ensemble des disciplines traitant (souvent en collaboration) des questions précédentes à l’aide du dilemme du prisonnier. Le dilemme du prisonnier est donc abordé comme le fondement potentiel des sciences sociales, permettant notamment de répondre à la question fondamentale : pourquoi les hommes coopèrent ? L’approche pluridisciplinaire qui est adoptée cherche à rendre compte de l’actuelle montée en puissance d’une vision nouvelle, « englobante », des sciences sociales. L’ouvrage ne nécessite aucun pré-requis, ni en économie, ni en mathématiques. La notion de dilemme du prisonnier est suffisamment simple et générale pour être comprise de manière « auto-référante ». De très nombreuses applications sont évoquées : en économie, en sociologie, en psychologie, mais aussi en anthropologie, en philosophie politique ou en biologie !

Exemple d’utilisation en classe : lien avec la biologie…

Parmi les applications les plus intéressantes (et peut-être les plus étonnantes), on notera la mobilisation en biologie de la version répétée du jeu pour envisager la question de l’évolution des normes de coopération chez les humains. Cette application du dilemme du prisonnier est essentielle car transversale à un grand nombre d’analyses en sciences sociales. Sur un plan pédagogique, on peut présenter les choses de manière véritablement captivante pour l’auditoire à travers la petite expérience suivante.

On explique aux élèves qu’ils vont jouer en binôme, par exemple avec leur voisin, un « match » en 10 manches, chaque « manche » correspondant au dilemme du prisonnier suivant :

 
C
D
C
3, 3
0, 4
D
4, 0
1, 1

Le gain total de chaque élève correspond à la somme des gains qu’il aura accumulés lors des 10 manches du jeu. À chaque manche, les élèves choisissent C ou D sans communiquer avec leur voisin. À la fin de chaque manche, ils confrontent leur choix avec celui de leur voisin et déterminent leur gain pour la manche en question en remplissant (période par période) le tableau suivant :

Manche
Mon choix
Son choix
Mes points
1
x
x
x
2
x
x
x
3
x
x
x
4
x
x
x
5
x
x
x
6
x
x
x
7
x
x
x
8
x
x
x
9
x
x
x
10
x
x
x
x
Total =

 

Ce jeu est très simple et distrayant pour les élèves. À la fin du jeu, l’enseignant demande aux élèves d’annoncer leurs gains totaux. Une discussion s’engage alors sur la stratégie suivie par les élèves ayant obtenu les gains les plus élevés, en faisant remarquer qu’il s’agit d’une stratégie au moins partiellement coopérative.

Le lien avec la théorie de l’altruisme réciproque, développée dans les années 1980 par le politologue Robert Axelrod et le biologiste William Hamilton[1], peut alors être facilement explicité. On peut démarrer en faisant remarquer aux élèves que la coopération est l’une des grandes énigmes de l’évolution de l’espèce humaine. Pendant longtemps, en effet, l’accent mis par la théorie darwinienne sur l’individualisme laissait peu de place aux comportements coopératifs. Or, l’homme coopère, non seulement avec les individus qui lui sont génétiquement liés (famille), mais également avec des étrangers. Une question cruciale est donc de comprendre cette évolution de l’espèce humaine vers la coopération, en étendant la théorie de la sélection naturelle issue de Darwin.

La théorie de l’altruisme réciproque explique que l’évolution vers un monde de coopération conditionnelle résulte des incitations égoïstes à la coopération émergeant dans le cadre de dilemmes du prisonnier répétés un très grand nombre de fois. Dans les expériences de dilemmes du prisonnier répétés, les stratégies de « coopération conditionnelle » ont des propriétés très particulières. Ce sont en effet des stratégies de ce type qui s’imposent quasi systématiquement dans les expériences fondées sur des simulations informatiques et consistant à confronter, dans des « tournois » de dilemmes du prisonnier, des stratégies proposées par des individus et traduites dans un programme informatique. Dans ce domaine, le pionnier est Robert Axelrod, professeur de science politique à l’Université du Michigan. Ses travaux dans les années 1980 ont montré la supériorité d’une stratégie de coopération conditionnelle particulière sur toutes les autres stratégies. Cette stratégie consiste à jouer la coopération lorsque l’autre joueur a lui-même coopéré, mais à ne plus coopérer dès que l’autre joueur cesse de le faire. Autrement dit, le joueur démarre le jeu en coopérant, puis réplique systématiquement l’action de son partenaire le tour précédent : si le partenaire a joué C le coup d’avant, il joue C, si le partenaire a joué D, il joue D. Cette stratégie est souvent qualifiée de stratégie « donnant-donnant » (« tit-for-tat ») ; c’est aussi la stratégie bien connue « œil pour œil, dent pour dent ».

Axelrod a montré que la stratégie donnant-donnant s’impose dans un monde où les joueurs font face à des dilemmes du prisonnier répétés. Pour cela, il avait invité des collègues de différentes disciplines à soumettre un programme pour jouer un dilemme du prisonnier répété 200 fois. Chaque programme contenait la stratégie que désirait suivre le joueur. Le jeu s’apparentait à un tournoi puisque chaque programme était confronté à tous les autres, à lui-même et à un programme aléatoire jouant au hasard. Le programme ayant accumulé le gain total le plus élevé était déclaré vainqueur du tournoi. Dans un premier temps, 14 programmes furent proposés, dont un programme donnant-donnant, soumis par le théoricien des jeux Anatol Rapoport. C’est précisément lui qui remporta le tournoi. Devant ce résultat, Axelrod organisa un second tournoi, avec des règles très proches de celles du premier. 62 programmes provenant de 6 pays différents furent soumis. C’est de nouveau le programme donnant-donnant (soumis par le même participant, Anatol Rapoport, et par aucun autre) qui l’emporta.

Généralement, les élèves ont un peu de difficulté à comprendre la victoire de la stratégie donnant-donnant dans les tournois de dilemmes du prisonnier répétés. Pour bien leur faire comprendre ce résultat fondamental en sciences sociales, on peut leur demander de considérer un tournoi simplifié entre trois joueurs. Le jeu de base est le dilemme du prisonnier suivant :

 
C
D
C
3, 3
0, 4
D
4, 0
1, 1

On suppose que :

Chaque stratégie est confrontée aux deux autres et à elle-même. Chaque match du tournoi consiste en une confrontation entre deux stratégies sur le jeu de base répété 10 fois. On demande alors aux élèves de démontrer que, dans ce tournoi ultra-simplifié, c’est bien le joueur 3 et sa stratégie donnant-donnant qui l’emporte (cf. pages 61-63 de l’ouvrage).

On notera que les résultats d’Axelrod ont été largement commentés car ils impliquent la supériorité du comportement coopératif dans un environnement de dilemmes du prisonnier répétés. Autrement dit, même dans un monde de conflits permanents, il serait « optimal » de se comporter de la manière suivante :

Ainsi, la société humaine devrait, par les seules forces de la rationalité individuelle de ses membres, tendre vers la coopération !

Même s’il semble qu’aucune espèce ne montre plus de propension à coopérer (notamment avec des étrangers) que l’espèce humaine, Axelrod et Hamilton notent que certains animaux adoptent également des comportements coopératifs et que, pour ces espèces aussi, l’évolution vers la coopération pourrait s’expliquer par une victoire de la stratégie donnant-donnant dans les interactions sociales régissant le monde animal (conflits liés au territoire, à la nourriture, à l’accouplement, etc.) et qui, bien souvent, ont la structure d’un dilemme du prisonnier. Cette hypothèse a naturellement conduit les biologistes à réaliser un certain nombre d’expériences sur les animaux pour tenter de démontrer des comportements de type donnant-donnant (cf., par exemple, l’expérience sur les épinoches du biologiste allemand Manfred Milinski[2]).

On pourra finalement faire remarquer que les recherches récentes en neurosciences tendent à confirmer l’idée que l’homme a été programmé génétiquement, au cours de l’évolution de l’espèce, pour coopérer avec ses congénères. Une expérience très simple permet de le démontrer. Des spécialistes de neurosciences ont observé, à l’aide d’un scanner, l’activation du cerveau de sujets faisant face à un dilemme du prisonnier répété[3]. En particulier, ils étudient l’activation d’une zone particulière, le striatum, connue pour être l’une des zones du cerveau associées à la satisfaction. Pour montrer qu’une situation coopérative s’instaurant avec un partenaire induit en elle-même une satisfaction (au-delà des gains monétaires qu’elle engendre dans le cadre du dilemme du prisonnier), les auteurs comparent l’activation du striatum lorsque les sujets font face à une situation de coopération avec un partenaire humain avec l’activation de la même zone lorsqu’ils font face à une situation coopérative avec un ordinateur. Les paramètres du jeu étant identiques dans les deux cas, les gains monétaires issus de la coopération sont les mêmes. Or, les chercheurs observent une activation du striatum nettement plus forte dans le cas où le partenaire est humain, ce qui suggère clairement que les sujets retirent une satisfaction supplémentaire (non monétaire) du seul fait d’avoir instauré une coopération avec un congénère…

Notes

[1] Axelrod R. et Hamilton W. [1981], « The Evolution of Cooperation », Science, 211, 1390-1396.

[2] Milinski M. [1987], « TIT FOR TAT in Sticklebacks and the Evolution of Cooperation », Nature, 325, 433-435.

[3] Rilling J., Gutman D., Zeh T., Pagnoni G., Berns G. et Kilts C. [2002], « A Neural Basis for Social Cooperation », Neuron, 35, 395-405.