AI在六人扑克中击败职业选手 -- ScienceDaily

来源: ScienceDaily

卡内基梅隆大学与Facebook AI合作开发的人工智能程序Pluribus在六人无限制德州扑克中击败了顶级职业选手,展示了其在多人扑克中的超人表现。Pluribus通过使用混合策略和高效的计算资源,成功地在与世界上一些最好的选手的比赛中取得了显著的胜利。

卡内基梅隆大学与Facebook AI合作开发的人工智能程序在六人无限制德州扑克中击败了顶级职业选手,这是世界上最受欢迎的扑克形式。

被称为Pluribus的AI击败了保持世界扑克巡回赛最多冠军记录的职业扑克选手Darren Elias和六次世界扑克系列赛冠军Chris "Jesus" Ferguson。每位职业选手分别与五个Pluribus副本进行了5000手扑克对决。

在另一个涉及13位职业选手的实验中,所有这些选手都在扑克比赛中赢得了超过100万美元的奖金,Pluribus一次与五位职业选手对决,总共进行了10,000手,再次获胜。

Pluribus在多人扑克中取得了超人的表现,这是人工智能和博弈论中公认的里程碑,这一里程碑已经开放了几十年。到目前为止,战略推理中超人AI的里程碑仅限于两方竞争。在如此复杂的游戏中击败其他五位玩家的能力为使用AI解决各种现实世界问题开辟了新的机会。

Pluribus的算法在其策略中创造了一些令人惊讶的特征。例如,大多数人类玩家避免“donk betting”——即在一轮结束时跟注,但在下一轮开始时进行下注。这被视为一个通常没有战略意义的弱动作。但Pluribus比它击败的职业选手更频繁地进行donk bets。

Pluribus的主要优势在于其使用混合策略的能力。这是人类试图做的同样的事情。对于人类来说,这是一个执行问题——以完全随机的方式做到这一点并始终如一地做到这一点。大多数人只是做不到。

Pluribus在统计上取得了显著的胜利,考虑到它的对手,这是特别令人印象深刻的。这个机器人不仅仅是在与一些普通的职业选手比赛。它是在与世界上一些最好的选手比赛。

Pluribus在计算上高效地使用了资源。最近在游戏中取得里程碑的AI使用了大量的服务器和/或GPU农场;Libratus使用了大约1500万核心小时来开发其策略,并在现场游戏比赛中使用了1400个CPU核心。Pluribus仅用12,400核心小时在八天内计算了其蓝图策略,并在现场比赛中仅使用了28个核心。

UUID: cd5b13d7-8eb9-4d8d-b631-5bfcd567af48

原始文件名: /home/andie/dev/tudou/annot/2009年英语网页/2009年网页/AI beats professionals in six-player poker -- ScienceDaily.txt

是否为广告: 否

处理费用: 0.0033 元