Deepstack comble l'écart entre les techniques d'IA pour des jeux d'informations parfaites - comme les vérificateurs, les échecs et les go - avec ceux des jeux d'informations imparfaits - comme le poker - pour raisonner pendant qu'il joue en utilisant «l'intuition» perfectionné par l'apprentissage en profondeur pour réévaluer sa stratégie à chaque décision.

Avec une étude terminée en décembre 2016 et publiée dans Science En mars 2017, Deepstack est devenu la première IA capable de battre des joueurs de poker professionnels chez Heads-Up No-Limit Texas Hold'em Poker.

Représentation continue

Deepstack calcule une stratégie basée sur l'état actuel du jeu pour le reste de la main, sans en maintenir un pour le jeu complet, ce qui entraîne une baisse de l'exploitabilité globale.

Recherche locale "intuitive"

Deepstack évite de raisonner sur le jeu complet restant en substituant le calcul au-delà d'une certaine profondeur avec une estimation rapide. Formé automatiquement avec Deep Learning, «l'intuition» de Deepstack donne une sensation intestinale de la valeur de la tenue de cartes dans n'importe quelle situation.

Arbres de lookahead clairsemé

Deepstack considère un nombre réduit d'actions, lui permettant de jouer à des vitesses humaines conventionnelles. Le système reflète des jeux en moins de cinq secondes en utilisant un simple ordinateur portable de jeu avec un GPU NVIDIA.

À propos de l'algorithme

Le premier programme informatique pour surpasser les professionnels humains à la tête de poker sans limite

Dans une étude terminée en décembre 2016 et impliquant 44 000 mains de poker, Deepstack a battu 11 joueurs de poker professionnels avec un seul en dehors de la marge de l'importance statistique. Dans tous les matchs joués, Deepstack a remporté 49 Big Blinds / 100 (toujours le pliage ne perdrait que 75 BB / 100), plus de quatre écarts-types de zéro, ce qui en fait le premier programme informatique à battre des joueurs de poker professionnels en tête-à-tête sans limite Texas Hold'em Poker.

comment avoir des tours gratuits sur coin master

Les jeux sont des affaires sérieuses

Ne laissez pas le nom vous tromper, les «jeux» d'informations imparfaites fournissent un modèle mathématique général qui décrit comment les décideurs interagissent. La recherche sur l'IA a une longue histoire d'utilisation de jeux de parlour pour étudier ces modèles, mais l'attention a été axée principalement sur des jeux d'information parfaits, comme les dames, les échecs ou. Le poker est le jeu quintessentiel d'informations imparfaites, où vous et votre adversaire tenez des informations que les autres n'ont pas (vos cartes).

2018
+3000
2 mBTC
AUD Bitcoin CAD ...
Live Casino
Curaçao (CGCB)
2010
+2000
10 €/$
AUD CAD EUR ...
Live Casino
Curaçao (CGCB)
GGBet 9.9
2016
+2000
20 $
USD EUR PLN ...
Live Casino
Curaçao (CGCB)
2010
+2500
20€
EUR USD
Live Casino
Curaçao (CGCB)

Jusqu'à présent, les approches compétitives de l'IA dans les jeux d'information imparfaits ont généralement raisonné sur l'ensemble du jeu, produisant une stratégie complète avant de jouer. Cependant, pour rendre cette approche réalisable dans la tête de la tête du Texas Hold’em - un jeu avec des situations beaucoup plus uniques qu’il n’y a des atomes dans l’univers - une abstraction simplifiée du jeu est souvent nécessaire.

Une approche fondamentalement différente

Deepstack est la première application théoriquement solide des méthodes de recherche heuristique - qui ont réussi dans des jeux comme les dames, les échecs et les jeux d'information imparfaits.

Au cœur de Deepstack est une refonte continue, un sain calcul de stratégie locale qui ne considère que des situations à mesure qu'ils surviennent pendant le jeu. Cela permet à Deepstack d'éviter de calculer une stratégie complète à l'avance, longeant le besoin d'une abstraction explicite.

joka vip

Pendant la refonte, Deepstack n'a pas besoin de raisonner sur l'ensemble du reste du jeu, car il remplace le calcul au-delà d'une certaine profondeur avec une estimation approximative rapide, "intuition" de Deepstack - une sensation intestinale de la valeur de la maintenance de cartes privées possibles Dans toute situation de poker possible.

Enfin, l'intuition de Deepstack, tout comme l'intuition humaine, doit être formée. Nous le formons avec l'apprentissage en profondeur en utilisant des exemples générés à partir de situations de poker aléatoires.

Deepstack est théoriquement solide, produit des stratégies beaucoup plus difficiles à exploiter que les techniques basées sur l'abstraction et bat les joueurs de poker professionnels au poker sans limite avec une signification statistique.

Partenaires de casino associés