Quand une IA de poker est devenue folle avec cinq-trois assortis (analyse)

Quand une IA de poker est devenue folle avec cinq-trois assortis (analyse)

Quand une IA de poker est devenue folle avec cinq-trois assortis (analyse)

Avatar de Marie Martin
Quand une IA de poker est devenue folle avec cinq-trois assortis (analyse)


Dans partie 1 Dans cette série d’articles, nous avons évoqué le fait que la grande majorité des joueurs de poker ne bluffent pas assez souvent.

En conséquence, leurs actions de mise représentent généralement « l’honnêteté » (mains de valeur) plutôt que la « malhonnêteté » (bluffs). Cela m’a amené à introduire ce que j’appelle le principe d’honnêteté.

Le principe d’honnêteté : Dans son ensemble, la communauté du poker bluffe bien moins qu’elle ne le devrait.

De l’autre côté du spectre se trouvent les intelligences artificielles comme Libratus, une création de l’Université Carnegie Mellon qui a récemment réussi à démolir certains des meilleurs joueurs de No Limit au monde. Aujourd’hui, nous allons examiner une main folle jouée par Libratus pour voir ce que nous pouvons apprendre de sa stratégie.

Bienvenue à la machine

Au cœur de la stratégie de Libratus se trouvait la capacité de la machine à réduire l’écart entre les mises de valeur et les bluffs, ce qui rendait très difficile pour les joueurs humains de deviner lequel était lequel. L’IA était beaucoup plus équilibrée que les humains. Il était donc assez difficile pour les humains de mettre la machine entre leurs mains.

Vous trouverez ci-dessous un exemple du niveau de sophistication apporté par Libratus. Dans un entretien avec Doug Polk, Daniel McAulay décrit une main folle qu’il a jouée contre l’ordinateur.

L’ordinateur avait 5♣ 3♣ et Daniel détenait X Oui (Les cartes spécifiques de Daniel n’ont pas d’importance ici). Daniel relance en position, Libratus 3-bet, Daniel 4-bet et finalement Libratus suit hors position.

Déjà, nous voyons une pièce peu intuitive de Libratus. La plupart des humains se coucheraient à chaque fois, ou pourraient peut-être bluffer en 5-bet. Un appel hors de position semble être un jeu perdant à moins que le joueur qui l’effectue ne soit capable de faire des paris « méchants » à l’avenir. Et Libratus capable l’était !

Le flop est venu K Q J♣. Libratus check et Daniel check avec son tirage couleur.

Le tour était un troisième donnant la couleur à Daniel. Libratus a vérifié et Daniel a vérifié à nouveau pour tromperie.

La rivière était une brique (quelque chose comme le 5♠) et Libratus misa avec sa maigre paire. Daniel a relancé petit, pour que cela ressemble à un bluff, et bien sûr, Libratus a fait tapis, transformant sa paire inférieure en bluff ! Daniel a suivi, bien sûr, et a remporté la main.

Lise aussi :  Conseils de paris sur la Ligue des champions – Guide de paris sur le football UCL

Cependant, Libratus perdre la main n’est pas la question. La ligne prise par l’ordinateur était à la limite de la folie que presque aucun humain n’est capable de prendre, en particulier un joueur gagnant qui sait qu’il représente une range très étroite, étant donné la façon dont il a joué passivement le tournant et la rivière.

C’est exactement le point. Un joueur parfaitement équilibré peut et se présentera avec n’importe quoi dans n’importe quelle situation et avec des fréquences optimales.. Veuillez noter que l’équilibre et l’optimalité sont ici les clés. Par exemple, les joueurs humains peuvent tenter d’entreprendre des actions qu’ils peuvent percevoir comme « aléatoires ». Mais en réalité, ces actions sont généralement fortement biaisées. Notre espèce n’a pas encore trouvé le moyen de trouver la frontière entre les deux.

Si la main ci-dessus vous semble un peu au-dessus de votre tête, vous n’êtes pas seul. Les meilleurs pros qui ont affronté Libratus ont ressenti la même chose, et ils ont à eux deux des millions (voire des dizaines de millions) de mains d’expérience au poker. Je le présente ici uniquement pour démontrer qu’il est presque impossible pour les humains de produire ce niveau de une imprévisibilité parfaitement équilibrée ; un mélange finement réglé qui laisse les adversaires devinertout en réalisant des bénéfices dans le processus.

Nous devrions prendre un moment pour comprendre à quel point c’est difficile.

Par exemple, il serait très facile pour Bob de ne jamais bluffer, étant ainsi totalement honnête et prévisible à tout moment. Il est tout aussi facile pour Bob de bluffer constamment, devenant ainsi encore une fois imprévisible puisque désormais les adversaires supposeront à juste titre que ses paris sont plutôt faibles. Dans les deux cas, Alice, l’adversaire de Bob, saura à quoi s’attendre et pourra ainsi ajuster sa stratégie en conséquence (simplement en se couchant beaucoup contre la première version et en ripostant contre la seconde).

Lise aussi :  Comment réagir à un check-raise au tournant : théorie vs pratique

Ce qui est difficile pour Bob, c’est de trouver la frontière entre bluffer et ne pas bluffer, de sorte qu’Alice n’a plus de décision claire. En deçà de cela, il serait soit trop honnête, soit trop malhonnête, ce qui pourrait être facilement exploité par un joueur très attentif comme Alice.

Note de l’éditeur

Si vous souhaitez apprendre certaines des tactiques et stratégies spécifiques utilisées par l’IA pour vaincre des joueurs de classe mondiale, vous devriez consultez le cours d’analyse Brains vs AI de Doug Polk.

Cerveau contre IA

Ce cours de 6 heures vous donne une place au premier rang pour écouter l’analyse de Doug des mains jouées par Libratus. Vous apprendrez comment l’IA a joué dans des pots à relance unique, des pots à 3-bet, des pots à 4-bet, comment elle a abordé le limp, et bien plus encore.

Cliquez ici pour en savoir plus >>

Bonne nouvelle, mauvaise nouvelle…

Ok, c’est une terrible nouvelle pour Bob qui n’a ni le temps ni l’envie d’élaborer une stratégie gagnante aussi élaborée et compliquée. Et Alice ? La stratégie optimale que Libratus semble se rapprocher sans effort ne semble pas du tout facile. Et ce n’est pas le cas. Alors, comment Alice a-t-elle pu le comprendre ? Heureusement, elle n’est pas obligée.

Alice ne joue pas au poker contre Libratus. Alice ne joue pas non plus au poker contre les meilleurs joueurs du monde. Alice joue au poker contre des gens comme Bob et parfois contre d’autres joueurs comme elle. Toutes ces personnes jouent selon le principe d’honnêteté, à quelques exceptions près, voire aucune.

Ce point précis a été clairement exprimé dans une déclaration introductive de Mason Malmuth et David Sklansky au début du livre de stratégie avancée de Mathew Janda : Applications du No Limit Hold’em. Le titre de leur déclaration était « Une mise en garde concernant le bluff-catcher » et il s’agissait essentiellement d’un avertissement sur les conséquences de l’ignorance du principe d’honnêteté lorsque l’on tente de suivre de gros paris de manière défensive.

Ce que leur déclaration essayait d’accomplir, c’était d’avertir les lecteurs qu’essayer de se protéger contre le bluff n’est pas nécessairement le choix le plus rentable. Cela est particulièrement vrai aux niveaux débutant et intermédiaire, où la plupart des joueurs ne bluffent pas autant qu’ils le devraient.

Lise aussi :  Discussions stratégiques à ne pas manquer de la communauté Upswing Engage : avril 2022

Il est possible pour Alice de s’assurer que Bob reste honnête en l’appelant de temps en temps pour le garder sur ses gardes. Mais si Bob bluffe déjà moins qu’il ne le devrait, chacun des appels d’Alice en perdrait un à long terme. Ne pas l’appeler du tout lui serait plus profitable.

Bien sûr, en ne suivant jamais les gros paris de Bob, Alice s’ouvre au théorique possibilité que Bob puisse théoriquement commencez à profiter d’elle en augmentant la fréquence de ses bluffs. En tant que personne qui essaie de résoudre le jeu de manière optimale, c’est exactement le point de vue de Janda. Si Alice arrête d’appeler, Bob pourrait théoriquement l’exploiter.

Bien sûr, le contrepoint de Malmuth et de Sklansky est que la plupart des Bobs ne sont pas assez bons pour s’en rendre compte et qu’il est donc peu probable qu’ils s’adaptent. Je suis entièrement d’accord. Bob n’est pas Libratus et Dieu merci pour ça !

Comme autre exemple, Dan B. fait valoir un point similaire dans son excellent article 3 appels théoriquement gagnants qui perdent en pratique. Dans ses mots :

Bien qu’un gros repli ne soit pas le jeu le plus sexy au poker, c’est généralement le bon.

Paraphrasant Andres « educa-p0ker » Artinano (également présenté dans l’article) :

…ce sont les « dossiers » qui sont capables de monter en puissance.

Gardez un œil sur la troisième et dernière partie de cette série d’articles la semaine prochaine.

Si vous voulez écraser votre jeu à domicile ou votre casino local, ne cherchez pas plus loin que le Livre de jeu postflop à 7 $. Ce cours intensif rapide vous apprendra un système éprouvé pour gagner au poker en moins de 2 heures.

Ne jouez pas une autre main sans cet outil à 7 $

Avec un prix aussi bas, le Playbook Postflop à 7 $ est une évidence si vous souhaitez définir vos fondamentaux…

…et constituer une plus grande bankroll.



Category:

Avatar de Marie Martin

Marie Martin est une blogueuse parisienne passionnée par le monde du poker, mêlant stratégie et psychologie du jeu dans ses écrits. Diplômée en économie, elle applique ses connaissances analytiques pour explorer les nuances du poker et partager des conseils avisés avec ses lecteurs.

RECENT POST


RECENT COMMENT