Fiche de révision : Introduction aux stratégies et équilibres en théorie des jeux

📋 Plan du Cours

  1. Stratégie faiblement dominante et Vickrey
  2. Élimination itérée et concours de beauté
  3. Stratégie maximin et poule mouillée
  4. Équilibre de Nash mixte par indifférence
  5. Duopole de Cournot et équilibre de Nash
  6. Dilemme du prisonnier et stratégie strictement dominante
  7. Structures classiques en forme normale
  8. Équilibre de Nash en meilleures réponses
  9. Représentations en forme extensive et normale
  10. Trois ingrédients d’un jeu et savoir commun

📖 1. Stratégie faiblement dominante et Vickrey

🔑 Notions clés & Définitions

  • Stratégie faiblement dominante : Une stratégie xi0x_i^0 est faiblement dominante pour ii si son utilité Ui(xi0,xi)U_i(x_i^0,x_{-i}) est au moins aussi grande que celle de toute autre action xix_i pour tout xix_{-i}, avec un strictement mieux pour au moins un $x
  • Stratégie strictement dominante : Une stratégie est strictement dominante si elle donne une utilité strictement supérieure à toute autre pour tout profil des autres joueurs, sans égalité possible.
  • Enchère Vickrey : L’enchère Vickrey est un mécanisme où le gagnant paie le montant de la deuxième meilleure offre, ce qui rend la vérité faiblement avantageuse.
  • Offre vraie : L’offre vraie correspond au fait de soumettre bi=vib_i=v_i, c’est-à-dire d’annoncer sa valeur réelle pour l’objet.

📝 Points essentiels

  • Définition SFD : xi0x_i^0 vérifie Ui(xi0,xi)Ui(xi,xi)U_i(x_i^0,x_{-i})\ge U_i(x_i,x_{-i}) pour tout xix_{-i}, avec >> pour au moins un xix_{-i}.
  • Conséquence SFD : jouer xi0x_i^0 ne peut jamais être pire que les autres réponses, et peut parfois être strictement meilleur ou ex-aequo.
  • Différence SSD vs SFD : la SSD impose >> partout (pas d’égalité), tandis que la SFD autorise des égalités (\ge).
  • Différence ex-aequo : en SSD, les égalités sont impossibles, alors qu’en SFD elles peuvent apparaître selon xix_{-i}.
  • Intuition Vickrey : le prix payé dépend des offres des autres, pas de ton propre montant, donc sur/sous-offrir ne peut pas te rendre perdant quand tu offres bi=vib_i=v_i.
  • Cas de bᵢ=vᵢ : si l’autre meilleure offre est r=70r=70, offrir 100 ou 120 donne le même prix 70 (ex-aequo possible), tandis que si r=110r=110, sur-offrir à 120 fait payer 110 pour une valeur 100 (perte possible).

💡 Astuce mémo

SFD = « jamais pire » : \ge partout, >> au moins une fois ; Vickrey = « je paie le 2e » donc bi=vib_i=v_i est sûr (parfois égal, jamais perdant).

📖 2. Élimination itérée et concours de beauté

🔑 Notions clés & Définitions

  • Élimination itérée : Méthode de théorie des jeux qui supprime successivement les stratégies dominées jusqu’à obtenir un ensemble de choix résiduel.
  • Concours de beauté : Jeu où l’on choisit un nombre et où le gain dépend de la proximité avec une fraction de la moyenne des choix.
  • Savoir commun : Situation où chacun sait une information, chacun sait que l’autre le sait, et ainsi de suite à l’infini.
  • Stratégie maximin : Stratégie qui maximise le pire gain possible d’un joueur afin de se protéger contre le scénario le plus défavorable.

📝 Points essentiels

  • Règle du concours de beauté : choisir un entier entre 0 et 100, et gagner si son nombre est le plus proche de 23\frac{2}{3} de la moyenne des nombres choisis.
  • Élimination 1 : tout nombre >67>67 est dominé car 23×100=67\frac{2}{3}\times 100=67 rend impossible d’être proche de la cible avec un choix supérieur.
  • Élimination 2 : en supposant le savoir commun que personne ne joue >67>67, la borne devient 67 puis 23×67=44\frac{2}{3}\times 67=44, donc tout choix >44>44 est dominé.
  • Convergence par élimination répétée : la suite des bornes descend 10067442919130100\to 67\to 44\to 29\to 19\to 13\to\dots\to 0, ce qui mène à ESSD=0\text{ESSD}=0.
  • Résultats expérimentaux : les joueurs naïfs (1 tour) choisissent ~33, les sophistiqués (2-3 tours) ~22, et les économistes pro choisissent 0 à 3, avec des gagnants typiques autour de 22 (pas 0).
  • Stratégie maximin : on cherche la stratégie qui maximise mon pire gain possible, donc l’objectif est la sécurité plutôt que l’optimalité.

💡 Astuce mémo

Élimination itérée : « on coupe les choix trop grands » jusqu’à ce que la borne tombe à 0 ; Maximin : « je choisis ce qui évite mon pire cas ».

📖 3. Stratégie maximin et poule mouillée

🔑 Notions clés & Définitions

  • Maximin : Stratégie de sécurité qui choisit la ligne maximisant le gain minimal possible face au pire cas.
  • Poule mouillée : Critère de prudence où l’on privilégie la protection contre le pire résultat plutôt que la performance moyenne.
  • Stratégie prudente : Stratégie issue du maximin, sélectionnée pour maximiser le minimum de gains garantis.
  • Équilibre de Nash : Profil de stratégies où chaque joueur n’a pas intérêt à dévier unilatéralement, compte tenu de la stratégie de l’autre.

📝 Points essentiels

  • Pour chaque stratégie de J1, on calcule son MINIMUM sur les réponses possibles de J2, puis on prend le MAXIMUM de ces minima.
  • Le maximin vise la sécurité : il maximise le pire gain possible, pas le meilleur gain réalisable.
  • Exemple : Fonce a min(-15,4)=-15 et Tourne a min(0,1)=0, donc maximin=max(-15,0)=0.
  • La stratégie prudente pour J1 est Tourne (car elle donne le meilleur minimum), même si elle n’optimise pas contre toutes les réponses.
  • Le profil (Tourne,Tourne) n’est pas forcément un équilibre de Nash : si J2 joue Tourne, J1 préfère Fonce car 4>1.
  • Tableau utile : on peut organiser les colonnes avec la valeur Min J1 pour repérer directement la ligne maximin.

💡 Astuce mémo

Maximin = MAX des MIN : on choisit la ligne dont le pire résultat est le moins mauvais.

📖 4. Équilibre de Nash mixte par indifférence

🔑 Notions clés & Définitions

  • Stratégies mixtes : Stratégies où un joueur choisit une action au hasard selon une distribution de probabilités.
  • Indifférence : Propriété d’un joueur qui obtient le même gain espéré pour toutes les actions qu’il met dans son support.
  • Équilibre de Nash mixte : Profil de stratégies mixtes où chaque joueur maximise son gain espéré compte tenu des stratégies des autres.
  • Support d’une stratégie mixte : Ensemble des actions jouées avec probabilité positive par un joueur dans son équilibre mixte.

📝 Points essentiels

  • Dans un équilibre mixte par indifférence, chaque action jouée avec probabilité positive donne le même gain espéré au joueur concerné.
  • Si un joueur est indifférent entre deux actions, il peut les randomiser sans perdre en optimalité par rapport à l’autre.
  • Dans l’exemple fourni, a=1/2a^*=1/2 et b=1/2b^*=1/2 : chacun randomise à 50/50.
  • Dans cet exemple, il n’y a qu’un seul équilibre en stratégies mixtes (EN unique) et le gain espéré est 00 pour les deux joueurs.
  • Le gain espéré nul signifie que, malgré la randomisation, aucun joueur n’obtient d’avantage moyen sur l’autre dans l’équilibre décrit.

💡 Astuce mémo

Indifférence = égalité des gains espérés sur le support : si les gains sont égaux, la randomisation (ex. 50/50) ne change rien.

📖 5. Duopole de Cournot et équilibre de Nash

🔑 Notions clés & Définitions

  • Dilemme du Prisonnier : Jeu à deux joueurs où chaque choix (se taire ou dénoncer) produit des gains individuels qui rendent la coopération difficile sans communication.
  • Rationalité individuelle : Principe selon lequel chaque joueur choisit l’action qui améliore son propre gain, même si cela peut nuire au résultat collectif.
  • Stratégie strictement dominante : Stratégie qui donne à un joueur un gain strictement supérieur quelle que soit l’action de l’autre joueur.
  • Équilibre de Nash : Profil de stratégies où aucun joueur ne peut améliorer son gain en changeant unilatéralement sa stratégie.
  • Optimum collectif : Issue qui maximise le bien-être total des joueurs, même si elle n’est pas atteinte spontanément par des choix individuels rationnels.

📝 Points essentiels

  • Dans le Dilemme du Prisonnier, la rationalité individuelle ne garantit pas l’optimum collectif.
  • Dans la matrice, l’issue (S,S) donne 3,3 et correspond à l’optimum collectif, mais elle n’est pas stable.
  • Pour J1, si J2 joue S alors D donne 5 contre 3, donc D est meilleur.
  • Pour J1, si J2 joue D alors D donne 0 contre -1, donc D est encore meilleur.
  • Par symétrie, D est une stratégie strictement dominante pour J2, menant à l’issue (D,D) avec gains (0,0).
  • Le profil (D,D) est un équilibre de Nash car chaque joueur est déjà sur une meilleure réponse à l’action de l’autre.

💡 Astuce mémo

SSD = « toujours mieux » : peu importe la colonne, la ligne D reste gagnante.

📖 6. Dilemme du prisonnier et stratégie strictement dominante

🔑 Notions clés & Définitions

  • Dilemme du prisonnier : Jeu à deux joueurs où chaque joueur choisit entre se taire et dénoncer, avec un conflit entre intérêt individuel et optimum collectif.
  • Stratégie strictement dominante : Stratégie qui donne un gain strictement meilleur quelle que soit la décision de l’autre joueur.
  • Équilibre de Nash en stratégies pures : Profil de stratégies où chaque joueur choisit une meilleure réponse à la stratégie de l’autre, sans randomiser.
  • Équilibre de Nash sous-optimal : Équilibre de Nash qui n’atteint pas le meilleur résultat possible pour l’ensemble des joueurs.
  • Pareto-supérieur : Issue où au moins un joueur est mieux loti et aucun joueur n’est moins bien loti par rapport à une autre issue.

📝 Points essentiels

  • Dans le dilemme du prisonnier, la matrice (gain J1, gain J2) est : (Se taire,Se taire)=(3,3), (Se taire,Dénoncer)=(-1,5), (Dénoncer,Se taire)=(5,-1), (Dénoncer,Dénoncer)=(0,0).
  • Dénoncer est une stratégie strictement dominante pour J1 : si J2 joue Se taire, 0>-1 donc D domine S ; si J2 joue Dénoncer, 0>-1 donc D domine encore S.
  • Par symétrie, Dénoncer est aussi strictement dominante pour J2, donc l’issue (Dénoncer,Dénoncer) est l’ESSD.
  • L’ESSD du dilemme du prisonnier est (Dénoncer,Dénoncer)=(0,0), et c’est un équilibre de Nash en stratégies pures.
  • Le résultat (Se taire,Se taire)=(3,3) est Pareto-supérieur à (0,0) mais instable car chaque joueur a intérêt à dévier vers Dénoncer.
  • Propriété clé : si une stratégie strictement dominante existe, elle est unique et doit être jouée sans connaître le choix de l’adversaire.

💡 Astuce mémo

Dominance = « toujours mieux » : D bat S contre S et contre D, donc (D,D) s’impose même si (S,S) est meilleur collectivement.

📖 7. Structures classiques en forme normale

🔑 Notions clés & Définitions

  • Forme normale : Représentation d’un jeu simultané où chaque joueur choisit sa stratégie sans connaître celle des autres au moment du choix.
  • Forme extensive : Représentation d’un jeu séquentiel qui décrit l’ordre des décisions via un arbre et des informations disponibles à chaque étape.
  • Jeux simultanés : Jeux où les joueurs choisissent leurs stratégies en même temps, ce qui rend la forme normale particulièrement pratique.
  • Dominance : Propriété d’une stratégie qui donne un gain au moins aussi bon qu’une autre, quelle que soit la stratégie des adversaires.
  • Équilibre de Nash : Profil de stratégies où chaque joueur joue une meilleure réponse à ce que font les autres, sans regret a posteriori.

📝 Points essentiels

  • La forme normale est plus commode pour analyser les jeux simultanés, car elle résume les choix sans ordre temporel explicite.
  • La forme extensive est plus adaptée aux jeux séquentiels, car elle encode l’ordre des décisions et l’information disponible.
  • Dans les jeux simultanés, on étudie souvent la dominance pour éliminer des stratégies et simplifier l’analyse.
  • L’équilibre de Nash généralise l’idée de “pas de déviation unilatérale rentable” quand il n’existe pas de stratégie dominante.
  • Un jeu peut admettre 0, 1 ou plusieurs équilibres de Nash, selon la structure des gains.

💡 Astuce mémo

Simultané → Forme normale (choix en même temps) ; Séquentiel → Forme extensive (ordre dans l’arbre).

📖 8. Équilibre de Nash en meilleures réponses

🔑 Notions clés & Définitions

  • Équilibre de Nash : Un équilibre de Nash est un profil de stratégies où chaque joueur choisit une meilleure réponse à celles des autres.
  • Meilleure réponse : Une meilleure réponse est une stratégie qui maximise le gain d’un joueur compte tenu des stratégies choisies par les autres.
  • Équilibre de Nash pur : Un équilibre de Nash pur est un équilibre où chaque joueur joue une stratégie unique (sans randomisation).
  • Équilibre de Nash mixte : Un équilibre de Nash mixte est un équilibre où au moins un joueur randomise entre plusieurs stratégies avec des probabilités.
  • Jeu fini : Un jeu fini est un jeu où le nombre de joueurs, d’actions et de déroulements possibles est limité.

📝 Points essentiels

  • Un jeu peut avoir 0, 1 ou plusieurs équilibres de Nash selon sa structure et ses gains.
  • Le théorème de Nash (1951) garantit qu’un jeu fini possède au moins un équilibre de Nash, pur ou mixte.
  • Dans les jeux simultanés, un équilibre de Nash correspond à l’absence d’incitation unilatérale à changer de stratégie.
  • L’équilibre mixte apparaît quand aucune stratégie pure n’est une meilleure réponse contre les stratégies des autres.
  • Dans la matrice des gains, un équilibre de Nash est repérable par le fait que chaque composante est une meilleure réponse à la composante de l’autre joueur.

💡 Astuce mémo

EN = “N” comme “No deviation” : personne ne gagne en changeant seul sa stratégie.

📖 9. Représentations en forme extensive et normale

🔑 Notions clés & Définitions

  • Dilemme du Prisonnier : Jeu où la rationalité individuelle conduit à un résultat collectif moins bon que l’issue coopérative.
  • Bataille des sexes : Jeu de coordination où deux joueurs préfèrent se coordonner mais pas sur le même choix.
  • Poule mouillée : Jeu de conflit où chaque joueur hésite à s’exposer, ce qui rend la prudence stratégique dominante.
  • Chasse au cerf : Jeu de coordination où plusieurs équilibres existent et où l’issue Pareto-ordonnée est collectivement préférable.
  • Savoir commun : Hypothèse où chaque joueur sait qu’un fait est vrai, sait que l’autre le sait, et ainsi de suite à l’infini.

📝 Points essentiels

  • Un jeu se décrit par trois ingrédients : joueurs, ensembles de stratégies, et fonctions de paiements (gains) dépendant de toutes les actions.
  • Une stratégie pure correspond à une action certaine, tandis qu’une stratégie mixte attribue des probabilités à des actions pures.
  • Les paiements sont notés Ui(x1,,xn)U_i(x_1,\dots,x_n) : le gain de ii dépend des choix de tous les joueurs.
  • L’utilité cardinale de von Neumann–Morgenstern permet de calculer des espérances d’utilité à partir de probabilités.
  • Le savoir commun (rationalité réciproque à l’infini) justifie l’élimination des stratégies dominées : chacun sait que l’autre ne les jouera pas, et le raisonnement se répète.

💡 Astuce mémo

Savoir commun = « je sais que tu sais… à l’infini » ; donc on élimine ce que personne ne jouera (stratégies dominées).

📖 10. Trois ingrédients d’un jeu et savoir commun

🔑 Notions clés & Définitions

  • Rationalité : La rationalité désigne l’idée qu’un joueur choisit une action qui maximise son intérêt compte tenu de ses anticipations sur les autres.
  • Anticipation : L’anticipation est le raisonnement par lequel un joueur prévoit les choix des autres avant de décider de sa propre action.
  • Savoir commun : Le savoir commun est une situation où chaque joueur sait un fait, sait que les autres le savent, et ainsi de suite à l’infini.
  • CK (Common Knowledge) : Le CK regroupe les informations partagées comme savoir commun, permettant d’utiliser la logique pour résoudre le jeu.
  • Backward induction : La backward induction est une méthode de résolution qui détermine les choix en remontant les décisions depuis la fin du jeu.

📝 Points essentiels

  • Si chaque joueur sait que l’autre est rationnel, chacun peut raisonner sur ce que l’autre fera en fonction de son propre choix.
  • Le raisonnement devient une chaîne d’anticipations : chacun sait que l’autre sait que lui est rationnel, et cela se répète indéfiniment.
  • Sans savoir commun (CK), un joueur pourrait croire qu’il joue contre un adversaire irrationnel, ce qui casse l’usage de la logique pour résoudre le jeu.
  • Le CK justifie l’élimination itérée, car on peut supposer que les rationalités et les raisonnements sont partagés par tous.
  • Le CK justifie aussi la backward induction, car la logique de décision peut être appliquée de manière cohérente à chaque étape.
  • Comparaison : dans l’incertain, l’adversaire n’est pas un agent qui anticipe votre comportement, alors qu’en théorie des jeux l’autre réfléchit et anticipe pendant que vous faites de même.

💡 Astuce mémo

Savoir commun = « je sais que tu sais… et ça tourne en boucle » ; CK = carburant de la logique (élimination itérée et backward induction).

📊 Tableaux de synthèse

SSD vs SFD (dominance)

CritèreSSDSFD
InégalitéStricte (>) partout≥ partout, > au moins 1 fois
Ex-aequoImpossibleAutorisé
ExempleDénoncer (DP)Offrir sa vraie valeur (Vickrey)

⚠️ Pièges & confusions fréquents

  1. Confondre SFD et SSD : en SFD on a ≥ partout (avec au moins un strict), alors qu’en SSD c’est > partout et sans égalité.
  2. Croire que “Vickrey rend toujours strictement meilleur” : en fait bᵢ=vᵢ peut donner ex-aequo (ex. r=70), mais ne peut pas être pire.
  3. Se tromper sur le concours de beauté : la cible est 2/3 de la moyenne, donc l’élimination part de 2/3×100=67 puis se répète avec la borne.
  4. Penser que l’ESSD du concours de beauté est “ce que les gens font” : les expériences donnent ~33 puis ~22, alors que la borne théorique mène à 0.
  5. Confondre maximin et équilibre : le maximin (poule mouillée) maximise la sécurité, mais (Tourne,Tourne) n’est pas forcément un EN.
  6. Croire que (Tourne,Tourne) est un équilibre parce que c’est “prudence” : si l’autre joue Tourne, jouer Fonce peut être meilleur (4>1).
  7. Confondre EN et “optimum collectif” : dans le dilemme du prisonnier, (S,S) est Pareto-supérieur mais instable car chacun a intérêt à dévier vers Dénoncer.

✅ Checklist Examen

  1. Donner la définition d’une stratégie faiblement dominante (SFD) et expliquer la différence avec la strictement dominante (SSD).
  2. Expliquer pourquoi, dans l’enchère Vickrey, l’offre vraie bᵢ=vᵢ est une SFD (parfois ex-aequo, jamais pire).
  3. Lire et interpréter le tableau Vickrey : r=70 (ex-aequo possible) et r=110 (sur-offrir peut faire perdre).
  4. Décrire le raisonnement d’élimination itérée (ESSD) et l’utiliser sur le concours de beauté : 100→67→44→29→19→13→…→0.
  5. Énoncer la règle du concours de beauté (proximité de 2/3 de la moyenne) et justifier pourquoi choisir >67 puis >44 est dominé via le savoir commun.
  6. Définir la stratégie maximin et appliquer la méthode MAX des MIN à l’exemple Fonce/Tourne (min(-15,4), min(0,1), puis max).
  7. Savoir conclure que le profil (Tourne,Tourne) n’est pas forcément un équilibre de Nash et expliquer pourquoi une déviation unilatérale peut être rentable.
  8. Calculer un équilibre mixte par indifférence dans le jeu du Penalty : trouver b* rendant le Tireur indifférent puis a* rendant le Gardien indifférent, et conclure à {1/2,1/2}.
  9. Définir l’équilibre de Nash (EN) et reconnaître un EN pur dans une matrice par “meilleure réponse” des deux côtés.
  10. Résoudre le dilemme du prisonnier : écrire la matrice (3,3),(-1,5),(5,-1),(0,0), identifier la SSD Dénoncer et l’ESSD (D,D)=(0,0).
  11. Expliquer pourquoi l’EN du dilemme du prisonnier est sous-optimal (Pareto-supérieur de (S,S) mais instable).
  12. Identifier les 3 ingrédients d’un jeu (joueurs, stratégies, paiements) et expliquer le rôle du savoir commun (CK) pour justifier élimination itérée et backward induction.

Testez vos connaissances

Testez vos connaissances sur Introduction aux stratégies et équilibres en théorie des jeux avec 20 questions à choix multiples avec corrections détaillées.

1. Dans une enchère de Vickrey, pourquoi annoncer sa valeur réelle peut-il être une stratégie faiblement dominante ?

2. Quelle différence distingue une stratégie strictement dominante d’une stratégie faiblement dominante ?

Faire le QCM →

Révisez avec les flashcards

Mémorisez les concepts clés de Introduction aux stratégies et équilibres en théorie des jeux avec 20 flashcards interactives.

Stratégie faiblement dominante — définition ?

Une stratégie qui ne peut jamais être moins bonne et parfois mieux.

Vickrey — principe du paiement ?

Le gagnant paie le prix de la deuxième meilleure offre.

Élimination itérée — but ?

Supprimer stratégies dominées jusqu’à stabilité.

Voir les flashcards →

Cours similaires

Crée tes propres fiches de révision

Importe ton cours et l'IA génère fiches, QCM et flashcards en 30 secondes.

Générateur de fiches