Paradoxe de Saint-Pétersbourg
Le paradoxe de Saint-Pétersbourg se résume à la question suivante : pourquoi, alors que mathématiquement l'espérance de gain est infinie à un jeu, les joueurs refusent-ils de jouer tout leur argent ? Il s'agit donc non d'un problème purement mathématique mais d'un paradoxe du comportement des êtres humains face aux événements d'une variable aléatoire dont la valeur est probablement petite, mais dont l'espérance est infinie. Dans cette situation, la théorie des probabilités dicte une décision qu'aucun acteur raisonnable ne prendrait.
Historique
Ce paradoxe a été énoncé en 1713 par Nicolas Bernoulli[1]. La première publication est due à Daniel Bernoulli, « Modèle:Lang », dans les Commentarii de l'Académie impériale des sciences de Saint-Pétersbourg[2] (d'où son nom). Mais cette théorie remonte à un courrier privé de Gabriel Cramer à Nicolas Bernoulli, dans une tentative de réponse à ce paradoxe[3]. Pour ces deux auteurs, le joueur refuse de tout miser car il ne peut risquer de perdre tout son argent. Dans cette théorie de l'espérance morale formalisée par Bernoulli, ils introduisent une fonction d'utilité marginale. Cependant, ces deux auteurs divergent sur la fonction d'utilité : logarithme naturel pour Bernoulli et racine carrée pour Cramer.
Ces idées sont reprises plus tard par les marginalistes. Puis la théorie de l'espérance morale fut largement débattue dans les années d'après-guerre[4]. Des mathématiciens comme Émile Borel jugent cette théorie intéressante sur un point de vue psychologique mais sans intérêt pratique et maintenant « abandonnée »[5], tandis que des économistes s'intéressant à la théorie des jeux développent largement le concept et la fonction utilité. Maurice Allais propose une étude systématique du comportement des agents économiques et souligne la difficulté de définir la rationalité d'un agent économique dans une théorie du risque[6].
Le jeu
Il oppose un joueur et une banque dans un jeu à somme nulle. Le joueur parie une mise initiale, encaissée par la banque. On lance une pièce de monnaie à pile ou face tant qu'elle sort pile, le jeu se termine quand face apparaît et alors la banque paie son gain au joueur. Ce gain est initialement d'un euro, doublé pour chaque apparition de pile. Ainsi, le gain est de 1 si face apparait au premier lancer, 2 si face apparait au deuxième, 4 au troisième, 8 au quatrième, etc. Donc, si face apparaît pour la première fois au n-ième lancer, la banque paie euros au joueur.
La question
Quelle est la mise initiale du joueur pour que le jeu soit équitable, c'est-à-dire pour que la mise initiale du joueur (soit le gain de la banque) soit égale à son espérance de gain (soit la perte de la banque), ni la banque ni le joueur ne soient avantagés par ce jeu ? Autrement dit, quel est le gain moyen espéré du joueur au cours d'une partie ?
Calcul
Si face intervient dès le premier lancer, on gagne 1 euro. La probabilité pour que cela arrive est ½, ce qui donne une espérance de gain pour ce cas de 1/2× 1=1/2. Si face intervient pour la première fois au Modèle:2e, ce qui se produit avec une probabilité de ½×½=1/4, le gain est de 2 euros, ce qui fait une espérance de gain de 1/2 euro pour ce cas. Plus généralement, si face apparaît pour la première fois au n-ième lancer, ce qui se produit avec une probabilité de ½n, le gain est de 2(n-1) euros, d'où une espérance de gain de 1/2 euro pour ce coup.
L'espérance s'obtient en sommant les espérances de gain de tous les cas possibles. On somme une infinité de termes qui valent tous 1/2 : la somme est donc infinie. Le jeu est donc favorable au joueur (défavorable à la banque) dans tous les cas, sauf si la mise initiale était infinie.
Le paradoxe
Le paradoxe réside dans le fait qu'il serait rationnel, si le gain seul importait, d'offrir de miser la totalité de ses biens pour pouvoir jouer à ce jeu dont on vient de voir qu'il offrait une espérance de gain infinie (donc bien supérieur à n'importe quelle mise), et que pourtant personne, observe Daniel Bernouilli, ne ferait une chose pareille.
La réponse à ce paradoxe a été de trois ordres : les gens ne le font pas
- par incapacité à se représenter le calcul correct et son résultat ;
- parce que la valeur accordée à une somme d'argent n'est pas une fonction simplement linéaire : on accorde à chaque euro supplémentaire une utilité différente.
- parce que le risque est un coût, et qu'une chance sur deux de gagner deux euros ou zéro, ça ne vaut pas un euro : aversion au risque ;
Ces trois axes ne s'opposent pas, ils peuvent être vrais en même temps et ainsi contribuer à la décision de limiter sa mise.
Difficulté à comprendre
Pour Émile Borel, « Il y a, à mon avis, un très grand intérêt scientifique et social à ce que les principes fondamentaux du calcul des probabilités soient admis sans restriction par le plus de personnes possible »[1]. Le paradoxe illustre pour lui que, faute de cette capacité les gens ne sont pas en mesure de mesurer le gain, feront une mise inadéquate (trop basse dans ce jeu, ou peut-être trop haute dans un autre jeu) ou encore préféreront refuser un jeu qui leur semble trop complexe.
Utilité
Modèle:Voir La notion d'utilité est présente dès l'époque de Bernoulli, mais ne se développe que vers le milieu du Modèle:S. Elle traduit le fait que chaque euro supplémentaire a d'autant moins de valeur que vous en avez déjà plus, que un euro de plus a moins d'importance si vous avez mille euros en poche qui si vous n'avez rien, que dix millions d'euros vous sont plus utiles que un million mais pas dix fois plus.
Pour Daniel Bernoulli, c'est l'utilité qui importe au joueur et non le gain, et cette utilité est décroissante, logarithmique, ce qui signifie que le doublement de la somme gagnée ne fait qu'accroitre d'une unité l'utilité. Dans le cadre du paradoxe, l'utilité prend alors une valeur finie et relativement faible, ce qui rend rationnel de faire une mise limitée.
Aversion au risque
Ce comportement d'apparence irrationnelle est à l'origine de la notion d'aversion au risque. Il a été formalisé sous la forme de fonction d'utilité et a donné naissance à la théorie de la décision[7].
En définitive, la décision de jouer ou de ne pas jouer à ce jeu est analogue à la décision d'investir ou non dans un produit financier : elle doit dépendre de la relation au risque de chaque individu, elle même dépendant elle-même de nombreux paramètres, comme la fortune de départ, la somme qu'on est prêt à perdre, la pression sociale, les usages alternatifs qu'on pourrait faire de la mise, le nombre de fois qu'il serait admis de jouer au jeu, etc. En finance, le ratio de Sharpe illustre que les décisions rationnelles sont fondées sur l'analyse du rapport bénéfice/risque, et non sur la seule analyse du premier de ces deux paramètres.
Ce paradoxe montre que la notion d'espérance n'est pas toujours suffisante en probabilités. Si le gain est ici « en moyenne » infini, il faut disposer de fonds eux aussi infinis et jouer une infinité de fois pour pouvoir bénéficier de gains à coup sûr.
Formalisation mathématique
Soit la probabilité que face apparaisse seulement au bout de k lancers, la probabilité d'avoir (k-1 fois) pile puis face,
L'espérance de gain,
Fonction d'utilité
En introduisant une fonction d'utilité qui ne croit pas trop vite, par exemple , on définit une espérance d'utilité qui est finie,
Le choix d'une telle fonction n'est qu'un exemple, couramment utilisé mais qui ne reflète pas vraiment la réalité de l'expérience en question. Si l'utilité d'un euro est de 1, l'utilité de 15 euros est très proche de 15. Ce n'est que pour des valeurs très grandes que l'utilité décroît.
Variante du jeu : montant fini
Si on suppose que la banque ne dispose que d'une somme finie, les calculs sont les mêmes, à ceci près que la série n'est plus infinie. Par exemple, si on suppose qu'elle ne dispose « que » 2N euros, la banque ne pourra pas payer plus si face apparaît au bout de N+1 lancers. Pour obtenir l'espérance de gain moyen on somme toutes les probabilités de gain. L'espérance de gain est maintenant finie.
Le jeu est équitable si la mise de départ est égale à (N+2)/2 euros. Une mise plus haute est défavorable au joueur, une mise moins haute est défavorable à la banque.
Ainsi, pour une valeur réaliste du capital de la banque, par exemple un milliard d'euros, la mise équitable sera de seize euros ; ce résultat lui aussi réaliste (et compatible avec l'intuition des joueurs) semble n'avoir été que rarement remarqué (c'est par exemple la solution que donne George Gamow à ce paradoxe dans Puzzle Math[8]).
Autres variantes
Notons que l'espérance de gain est infinie même si les règles du jeu sont légèrement modifiées de façon à apparaître a priori encore plus avantageuses pour la banque. Soit fixés, le joueur ne reçoit le gain que si face apparait au bout de lancers, si face apparaît avant le joueur ne touche rien.
Notes et références
Voir aussi
Bibliographie
Article connexe
- ↑ 1,0 et 1,1 Modèle:Article).
- ↑ Modèle:En S. M. Stigler, Statistics on the Table. The History of Statistical Concepts and Methods, Cambridge, Harvard University Press, 1999.
- ↑ Émile Borel, Probabilité et certitude, Que sais-je ? 1950.
- ↑ Modèle:Article.
- ↑ Arrow, Kenneth J. (1974), The use of unbounded utility functions in expected-utility maximization: Response, Quarterly Journal of Economics, volume 88, pages 136-138.
- ↑ Modèle:Ouvrage.