nadoulek.net : mondialisation, civilisations, stratégie

Accueil > STRATEGIE > Bibliothèque d’articles > Chroniques de la stratégie > "Donnant, donnant", de Robert Axelrod, 1984

"Donnant, donnant", de Robert Axelrod, 1984

Théorie du comportement coopératif

mardi 28 janvier 2014, par Bernard NADOULEK

Le livre de Robert Axelrod, Donnant, donnant, pose la question suivante : "Comment réussir dans un monde d’égoïstes ?" et Axelrod répond : "Par la coopération !" Réponse étonnante, dans un monde dominé par l’intérêt égoïste, par la concurrence - entre les individus, entre les entreprises, entre les Etats - et par la guerre de tous contre tous. Et il ne s’agit pas seulement d’une opinion : Axelrod prouve l’efficacité de la coopération en s’appuyant sur les résultats d’une compétition de programmes informatiques, dont il va tirer une théorie du comportement coopératif.

En 1980, Robert Axelrod enseigne les sciences politiques à l’université du Michigan, où il va organiser une compétition entre des programmes informatiques. Ces programmes sont écrits par des chercheurs, spécialistes de la théorie des jeux. Cette compétition doit permettre de montrer s’il est plus efficace de coopérer ou de ne pas coopérer dans une situation de réciprocité. Selon Axelrod, cette expérience vise à donner des réponses à des questions telles que : "Doit-on continuer à rendre service à un ami qui ne rend jamais la pareille ? Une entreprise doit-elle répondre promptement à la demande d’une autre au bord de la faillite ? Avec quelle intensité les Etats-Unis devraient-ils réagir à une action très hostile de l’Union Soviétique et quel comportement peuvent-ils adopter pour inciter celle-ci à coopérer ?" (cette dernière question étant posée pendant la fin de la guerre froide). Avec la superposition de ces trois questions, Axelrod montre que son expérience vise autant les relations entre les individus, entre les entreprises, ou entre les Etats. Je résume ici les idées essentielles de ce livre, très riche d’enseignements.

Dans mon précédent article, qui annonçait la création du groupe "Créateurs francophones", j’annonçais que le pari de ce groupe était fondé sur la "théorie du comportement coopératif" d’Axelrod. Dans un post-scriptum à cet article, j’explique en quoi cette théorie s’applique à l’expérience que nous tentons avec les Créateurs francophones, en posant une nouvelle question : jusqu’où la coopération altruiste peut-elle aller ?


Une compétition entre des programmes informatiques

La première compétition engage 14 programmes informatiques. Chacun d’entre eux doit affronter ses adversaires en 5 manches de 200 coups. A chaque tour de jeu, ces programmes peuvent coopérer ou duper leurs adversaires. Les 14 programmes en lice vont des plus coopératifs aux moins coopératifs, des plus sophistiqués aux plus simples. Certains programmes coopèrent volontiers, d’autres dupent systématiquement leurs partenaires. Certains tentent de prévoir les réactions adverses en analysant les coups précédents. D’autres coopèrent globalement mais trahissent parfois pour l’emporter, ou encore ils commencent par coopérer, mais deviennent des programmes tueurs dès la première trahison adverse, etc. Le lecteur intéressé trouvera la description complète des stratégies mises en œuvre par les concepteurs de ces programmes dans le livre d’Axelrod, ou dans les nombreux commentaires ou mémoires disponibles sur Internet.

Pendant la compétition, à chaque échange, chaque programme informatique a le choix de coopérer ou de ne pas coopérer. La règle du jeu est formalisée par la matrice tirée du dilemme du prisonnier, où les programmes informatiques s’affrontent avec les quatre règles suivantes :

• Soit A et B coopèrent et ils ont 3 points chacun. C’est la "récompense pour une coopération mutuelle".

• Soit A trompe B, il a 5 points si B coopère, B a 0 point car il s’est fait duper. C’est "la tentation de l’égoïste et le salaire de la dupe".

• Soit B trompe A, il a 5 points si A coopère, A a 0 point car il s’est fait duper. C’est aussi, bien sûr, "la tentation de l’égoïste et le salaire de la dupe".

• Soit A et B ne coopèrent ni l’un, ni l’autre, et ils ont 1 point chacun. C’est "la punition de l’égoïste".

Si nous observons ces règles du point de vue du nombre de points qu’elles génèrent : la meilleure solution est de duper son adversaire et, en cas de réussite, de remporter 5 points ! Nous sommes donc bien dans un monde d’égoïstes : duper les autres rapporte 5 points et se faire duper 0 point. Coopérer ne rapporte que 3 points en cas de réciprocité et 0 point en cas de non réciprocité. Quand aucun des deux compétiteurs ne coopère, ils font le même mauvais score : 1 point. La question qui se pose est donc : quelle est la stratégie qui permet d’accumuler le maximum de points dans une compétition où 14 programmes vont s’affronter en 5 manches de 200 coups ?

Les résultats de la compétition

Le programme qui emporta la première manche fut "Donnant, donnant", d’Anatol Rapoport, un psychologue de l’université de Toronto. C’était le plus simple de tous les programmes, il contenait deux lignes d’instruction : la première, coopérer ; la seconde, refaire ce qu’a fait l’autre au coup précédent ! Autrement dit, "Donnant, donnant" commence toujours par coopérer au premier coup et, à partir du deuxième, il s’aligne sur le comportement de son vis-à-vis. Les stratégies les plus simples sont souvent les meilleures.

Axelrod publia ses résultats et organisa un deuxième tournoi, où 62 programmes venant de six pays furent confrontés. « Donnant, donnant » gagna ce deuxième tournoi. Il remporta également une troisième manche, selon les principes de l’évolutionnisme génétique. L’idée étant de faire plusieurs compétitions de suite avec les 62 programmes. A chaque tour de jeu, qui symbolise une génération, les programmes croissent ou décroissent selon leur score. Par exemple, un programme ayant obtenu un score deux fois plus élevé qu’un autre sera deux fois plus représenté dans la manche suivante, comme s’il avait eu deux enfants, au contraire de son adversaire moins performant qui n’en aurait eu qu’un seul. Ainsi les programmes performants croissent en nombre, et les programmes moins performants sont progressivement éliminés. C’est en quelque sorte une reproduction informatique du processus de sélection naturelle. "Donnant, donnant" l’emporta donc dans les trois versions successives de cette compétition.

Quelles conclusions Axelrod tira-t-il des résultats de son expérience ? Globalement, les résultats de la compétition montrent un net avantage des programmes coopératifs par rapport aux programmes tueurs. En effet, les programmes tueurs peuvent battre un programme bienveillant, mais n’accumulent que peu de points car, dès qu’un programme coopératif "réalise" qu’il est devant un programme tueur, il cesse de coopérer et les deux adversaires font un petit score. D’autre part, opposés les uns aux autres, les programmes tueurs s’éliminent réciproquement sans marquer de points. Au contraire, les programmes bienveillants qui coopèrent accumulent le maximum de points.

Mais un programme ne peut se contenter d’être bienveillant ; il doit non seulement pratiquer la rétorsion avec les programmes tueurs, mais aussi avec les programmes qui trahissent occasionnellement, pour les dissuader de continuer. C’est ce que fait "Donnant, donnant", avec simplicité et élégance, grâce à sa deuxième règle : refaire ce qu’a fait l’autre au coup précédent.

Les conclusions d’Axelrod

Axelrod énumère quatre règles qui contribuent à la réussite d’une stratégie :

• coopérer autant que possible en évitant tout conflit inutile ;

• riposter systématiquement en cas de trahison ;

• être indulgent et revenir à la coopération dès que l’adversaire fait de même ;

• avoir un comportement transparent pour que votre vis-à-vis puisse s’adapter à votre stratégie.

Ainsi nous pouvons adopter une philosophie coopérative sans naïveté, de manière pragmatique, en étant conscients de vivre dans un monde d’égoïstes dans lequel il faut souvent user de rétorsion, sans pour cela en faire une règle de vie.

Axelrod applique ensuite ses règles du comportement coopératif à des exemples tels que : la guerre des tranchées en 14-18, le comportement des assemblées législatives, les négociations internationales, l’évolution de la coopération dans les systèmes biologiques. Le résultat est à chaque fois le même : la coopération peut s’installer, même dans les situations les plus défavorables. Enfin, dans son dernier chapitre, "La structure sociale de la coopération", il recommande son système à tous ceux qui veulent réformer la société et il montre aussi, à travers son hypothèse biologique et évolutionniste, que plus les groupes coopératifs se multiplient, plus ils gagnent en efficacité.

Ce livre théorise l’action de millions de gens : bénévoles associatifs, membres d’associations citoyennes, partisans de l’économie solidaire ou de la coopération internationale. Une dizaine d’années après sa publication, il appuiera l’idéal libertaire et altruiste de la culture originelle d’Internet. Donnant, donnant offre une alternative à tous ceux qui espèrent un monde plus coopératif, plus solidaire, un monde moins dominé par un état de concurrence généralisé qui aggrave les inégalités. La coopération est une philosophie réaliste à laquelle nous pouvons souscrire sans naïveté.


version iPhone | Suivre la vie du site RSS 2.0 | Plan du site | SPIP | Nous contacter | S'abonner