Carnet du petit Tom : Physique, biologie et évolution...

15 juillet 2007

Cruels dilemmes

Le dernier numéro de Pour la Science contient un intéressant article de Kaushik Basu présentant un problème que je ne connaissais pas : le dilemme du voyageur (voir ici la version anglaise de l'article). Résumons ce dilemme en quelques mots :
deux voyageurs ayant acheté chacun le même objet sont victimes de la négligence d'une compagnie aérienne qui a brisé les dits objets. La compagnie aérienne se propose de dédomager les deux voyageurs sur la base de la règle suivante : chaque voyageur donne le prix de l'objet (compris entre 2 et 100 $). Si le prix donné par les voyageurs est identique, la compagnie verse la somme aux deux voyageurs. Si les prix sont différents, la compagnie considère qu'un des voyageurs est honnête tandis que l'autre se moque d'elle. Elle prend donc la somme minimale, verse cette somme + 2 $ au voyageur "honnête", et cette somme moins deux $ à l'autre. Par exemple, si le voyageur A dit 35 $ et le voyageur B 40 $, la compagnie verse 35+2=37 $ au voyageur A et 35-2=33 $ au voyageur B.

Ce problème n'est en fait qu'une variation sur le célèbre dilemme du prisonnier. Tout comme celui-ci, il se caractérise par une "instabilité" de l'équilibre maximisant le gain. Je m'explique : imaginons que A dise 100$. Si B dit 100$, les deux gagnent 100$. Mais si A dit 100$, B à tout intérêt à dire 99$, car dans ce cas, il gagne plus et empoche 101$. La stratégie rationnelle au sens de la théorie des jeux pour les deux joueurs serait alors de donner systématiquement 1$ de moins que la somme donnée par l'autre joueur. Cette stratégie rationnelle amène de proche en proche A et B à diminuer leurs estimations : si B dit 99$, A a intérêt à dire 98$, et ainsi de suite. En fait, tout est question d'anticipation de ce que dit l'autre voyageur, mais la seule situation d'équilibre est pour les deux joueurs de donner la somme minimale admise, i.e. 2$.

Evidemment, la stratégie semble un peu absurde, car si les deux joueurs donnent une somme conséquente, ils embaucheront bien plus. En fait, si on fait l'expérience en réalité, la plupart des gens donnent effectivement l'estimation maximale autorisée. Basuk en déduit que la "rationnalité" réellement raisonnable n'est pas la rationnalité de la théorie des jeux ou rationnalité économique [1].

La question qui m'est immédiatement venue à l'esprit est de savoir comment l'évolution pourrait sélectionner un comportement ou un autre (voir aussi ce billet sur un sujet similaire). Dans la nature, confronté à un problème type dilemme du voyageur, un animal a-t-il intérêt à être "égoïste", i.e. adopter un comportement équivalent à choisir 2$ pour s'assurer de ne pas "perdre" le jeu, ou "altruiste", i.e. adopter un comportement équivalent à miser gros en comptant sur ses partenaires pour que la coopération fasse émerger un gain maximal pour tous ? En fait, il semble qu'un certain nombre de travaux aient déjà été réalisés sur le sujet. Un site très intéressant (taumoda.com) propose simulations et contextes biologiques d'un problème d'évolution basé sur le dilemme du prisonier. En particulier, on peut voir sur cette page comment égoïstes et altruistes rentrent en compétition dans une population. La surprise est que pour certaines règles du jeu, on voit que les proportions d'altruistes et d'égoïstes se stabilisent dans la population. Intuitivement et dans le contexte "dilemme du voyageur", cela peut se comprendre : les égoïstes qui jouent entre eux se "détruisent" les uns les autres (en gagnant seulement 2$ à chaque fois), mais ceux-ci parviennent toutefois à survivre en se nourrissant sur le dos des altruistes (gagnant 4$ contre ceux-ci). Les altruistes, eux, survivent en coopérant : même si les égoïstes leur sucent le sang, ils parviennent à générer assez de coopération pour se maintenir à haute proportion dans la population. La conclusion majeure à mon avis, c'est que "l'évolution" ne favorise pas nécessairement l'un ou l'autre des comportements, mais plutôt un mélange des deux. Autremement dit, la sélection naturelle est efficace pour sélectionner à la fois les deux types de rationnalité !

[1] Une remarque à ce stade : en lisant l'article, on est bien vite convaincu que l'équilibre donné par la théorie des jeux n'est pas l'équilibre raisonnable. Rien n'est moins sûr : il semble pour moi qu'il faut aussi prendre en compte une sorte d'aversion au risque ou d'avidité au gain de certains joueurs. Imaginons par exemple qu'on parle ici non de dollars, mais de millions de dollars. Dans ce cas, jouer 2 vous assure d'avoir au moins 2 millions de dollars. Mais si vous tentez de jouer plus de 2, il suffit que l'autre joueur joue 2 pour que lui empoche 4 millions de dollars, tandis que vous-mêmes vous retrouvez avec 0. Dans cette situation, je pense que je jouerais 2 histoire d'être bien sûr de toucher quelque chose...

2 commentaires:

Spring a dit…

Salut,
Cet article me donne envie de poster quelques remarques…
- en fait on touche ici une des limites (que j'avais déjà vu exposée) de la théorie des jeux appliqué aux comportements humains : nous sommes capables d’anticiper le résultat d’un raisonnement itératif comme celui-ci et ne pas nous comporter comme des automates aveugles : cela paraît normal de vouloir gagner une petite centaine de dollars plutôt que 2…
- ici les deux joueurs font un pari : que l’autre joue le jeu pour tirer un maximum de sous à un tiers. Ils comptent sur l’avidité de l’autre pour s’enrichir. Cela fait très « Adams Smith’s spirit » tout ça… Nous sommes dans un phénomène contraire à celui de l’aversion au risque, plutôt dans un phénomène type loto (risquer de perdre 2 euros pour en gagner beaucoup plus…)
- Je suis très étonné de voir la faible rémunération de l’honnêteté dans cette expérimentation. Tant que le gain a être honnête sera négligeable devant le gain total, ce type de comportement sera observé.
- Concernant la notion d’echelle (remplacer les dollars par des millions de dollars), il ne faut pas oublier l’intérêt d’une fonction d’utilité non linéaire pour modéliser notre envie d’argent. Le premier million de dollar va nous apporter beaucoup plus de satisfaction que le dernier. Par conséquent gagner 100 millions de dollars n'est as 50 fois plus intéressant que d'en gagner 2. Cela change beaucoup la prise de risque que nous sommes près à faire (et il est tout a fait possible que l’aversion au risque prime dans un cas comme cela, comme tu le faisais remarquer)

Tom Roud a dit…

Merci Spring pour ce commentaire. Tout cela me fait penser qu'effectivement la forme de la fonction d'utilité (que cela soit pour l'effet loto, la faible rénumération de l'honnêteté ou encore l'échelle) est bien plus importante pour étudier ce genre de problèmes que le qualitatif (à savoir "l'instabilité" de l'équilibre qui maximise les gains individuels). C'est une leçon intéressante (qui j'imagine doit être bien connue en économie) à savoir que le qualitatif ne suffit pas et qu'il faut vraiment faire du quantitatif pour bien comprendre les choses. D'où l'intérêt des maths pour la modélisation économique, d'où l'intérêt de la théorie...