<tbody id='qu8u1kxt'></tbody>
    <tfoot id='oa5s21ir'></tfoot>

        1. <legend id='l0tle07b'><style id='3es40jh0'><dir id='4ajb7f12'><q id='pcy8owfh'></q></dir></style></legend>
          <i id='e99qa3eo'><tr id='hkwrdu6v'><dt id='vnw61zq1'><q id='7oyo9jm3'><span id='jbqnp5ta'><b id='6t3xu9lq'><form id='y9yj72d7'><ins id='2q3vxjc6'></ins><ul id='dmdrphd4'></ul><sub id='g8zjvhqe'></sub></form><legend id='pk8888vp'></legend><bdo id='zhb5keyo'><pre id='txcqrt6d'><center id='nue7dehr'></center></pre></bdo></b><th id='1o7dckjw'></th></span></q></dt></tr></i><div id='4jvb9h8d'><tfoot id='ivuu1m83'></tfoot><dl id='ib3fmii3'><fieldset id='sofjoqkh'></fieldset></dl></div>
              <bdo id='jprnfvn3'></bdo><ul id='rz041eeb'></ul>

              <small id='4aniwgwt'></small><noframes id='2cga5jig'>

              别杆斗地主下载
              -jj比赛斗地主残局15关:第三代AI_Pluribus首次在六发布日期:2020-08-22 浏览次数:

              2017年1月,人工智能程序Libratus在1对1无限德扑比赛中成功战胜了4名顶级职业玩家,但人们一直认为多人德州扑克对于AI是一项更艰巨的任务。

              但如今,这项任务已经达成!美国卡内基梅隆大学和Facebook公司7月12日在《科学》上发表论文称,他们联合开发的德扑人工智能Pluribus在六人桌无限德扑中击败了顶级人类玩家。

              这其中包括了获得过4次WPT(世界扑克巡回赛)冠军的DarrenElias、拥有6条WSOP(世界扑克锦标赛)金手链的“耶稣”ChrisFerguson,和在职业生涯中赚了将近200万美元的MichaelGagliano。

              从左至右,DarrenElias、ChrisFerguson、MichaelGagliano无论是一个Pluribus对战5个顶级人类玩家,还是五个Pluribus混战一个顶级人类玩家,经过1万手牌后,它的表现都会明显优于人类。

              “Pluribus”是一个拉丁语词汇,意为“众”,美国国徽上就印有“Epluribusunum”(合众为一)的字样。

              起这个名字,无疑彰显这是世界上首个在多人德扑中超越人类专业选手的AI。

              “Pluribus在多人扑克领域取得了超人的成绩,这在人工智能和博弈论领域是一个公认的里程碑,”卡内基梅伦大学计算机科学教授TuomasSandholm说。

              TuomasSanholm和其学生NoamBrown博士(目前在facebookAI项目组工作)共同开发了Pluribus。

              TuomasSandholm(左)与他的学生NoamBrown几十年来,扑克一直是人工智能领域一个困难而又重要的挑战。

              原因在于,扑克中含有隐藏信息,也就是说,你无法知道对方的牌。

              要想在扑克中获胜,你需要bluff(吓唬)或者使用其他策略,这在棋类比赛中一般是不需要的。

              这一点使得在扑克中应用人工智能变得非常困难。

              早在2015年4月到5月,由NoamBrown、TuomasSandholm开发开发的第一款德扑程序Claudico,就在匹兹堡轮流与包括当时世界排名第一的DougPolk在内的四名人类顶尖高手过招。

              那次比赛历时13天,共计2万局牌。

              但初出茅庐的德扑AI在赛程过半时,就已落后人类约46万个筹码,最终以大约73万个筹码的劣势铩羽而归。

              但是到了2017年1月,同样由NoamBrown、TuomasSandholm开发的人工智能程序Libratus,在持续20天的1对1无限制德扑比赛中成功战胜了4名全球顶级职业玩家。

              这也成为了继围棋之后,又一个高难度游戏被AI攻陷的里程碑事件。

              此时的人工智能已经学会了bluff,而且还可以看穿人类选手的bluff。

              但是从1对1到玩转6人对决,人工智能经历了怎样的进步。“虽手机斗地主赢钱的有吗然从二到六看起来是一个渐进的过程,但这实际上是一个巨大的挑战,”研究游戏与人工智能的纽约大学助理教授JulianTogelius表示。

              “多人游戏方面的研究,此前在所有游戏中都未有出现。

              ”据介绍,Facebook和卡内基梅隆大学设计的比赛分为两种模式,1个AI+5个人类玩家和5个AI+1个人类玩家,Pluribus在这两种模式中都取得了胜利。

              如果一个筹码值1美元,Pluribus平均每局能赢5美元,与5个人类玩家对战一小时就能赢1000美元。

              职业扑克玩家认为这些结果是决定性的胜利优势。

              实验中Pluribus与人类玩家对抗时的界面Pluribus可能改变职业牌手的游戏方式令人惊讶的是,Pluribus首先通过和自己对抗逐步学习如何使扑克行动对自己有利。

              Pluribus的核心策略是通过自我博弈的方式学习。

              在这一过程中,AI和自己进行对战万能手机斗地主辅助器,不使用任何人类游戏数据作为输入。

              AI首先随机地选择玩法,接着,随着决定每一步的行动后,逐渐提升性能,并对这些行动拟合概率分布。

              最终,AI的表现比之前的策略版本会更好。

              DarrenElias说,“它的最大优势是能够使用混合策略。

              这也是人类试图做到的事情。

              对人类来说重要的是执行——用完美随机的方式混合你的策略,而且始终一致。

              大多数人无法做到。

              图中显示的是在与顶尖玩家对战时Pluribus的筹码数量变化。

              直线表示实际结果,虚线表示一个标准差。

              ?出乎意料的是,Pluribus使用“反主动下注“(donkbet)的频率远超过职业牌手。

              职业牌手们通常认为这种下注比较弱。

              ChrisFerguson在比赛实验结束后说道,“Pluribus真是太难对付了!我们很难在任何一手中盯死它。

              它不仅非常擅长进行薄的价值下注,而且擅长从好手牌中赢得最大价值。

              ”Brown博士表示,Pluribus的一些策略“甚至可能改变职业牌手的游戏方式。

              人类
                <bdo id='4dxkv8d7'></bdo><ul id='eopxq8de'></ul>

                  <small id='d96be473'></small><noframes id='3koly9ii'>

                    <tbody id='5r7r3d1h'></tbody>

                  • <legend id='8absy8o1'><style id='oh6u1nvf'><dir id='kh1kxane'><q id='9b8oospp'></q></dir></style></legend>

                    <i id='wpea87qr'><tr id='yjqebc8n'><dt id='lkut8ty3'><q id='c7910h1j'><span id='7yla2skg'><b id='mdum0lek'><form id='h4aewkdl'><ins id='d9yp3xm7'></ins><ul id='4dfzqfyd'></ul><sub id='w9djtsbv'></sub></form><legend id='p6cb7fh2'></legend><bdo id='qtenaed9'><pre id='w08d06tv'><center id='kiuocp4c'></center></pre></bdo></b><th id='888d55vp'></th></span></q></dt></tr></i><div id='6agvvjy9'><tfoot id='d8hsp1fg'></tfoot><dl id='xq9y37fj'><fieldset id='p1k56hgw'></fieldset></dl></div>

                        <tfoot id='ndvln4b4'></tfoot>
                          <tbody id='7tda7b13'></tbody>
                        • <bdo id='qwa819fo'></bdo><ul id='5os2ae3v'></ul>

                            <small id='mqjgz5gl'></small><noframes id='bsz3uj5l'>

                            <i id='muvinxgb'><tr id='rddwmhqd'><dt id='ytolgazw'><q id='u5ha306z'><span id='mc5fzuyc'><b id='jx908ndq'><form id='g7oi6fgc'><ins id='fgh0p9x7'></ins><ul id='2mpxqbrf'></ul><sub id='85v3kbcj'></sub></form><legend id='bg0bq6vd'></legend><bdo id='k7a4th0s'><pre id='hyiukt05'><center id='cyfmgx0b'></center></pre></bdo></b><th id='eqkvt8c0'></th></span></q></dt></tr></i><div id='fbavys6h'><tfoot id='rtpn17kh'></tfoot><dl id='dxyhwgym'><fieldset id='v7f0byy6'></fieldset></dl></div>

                                  <legend id='avu2nmz7'><style id='nre60in3'><dir id='d6tvhbdi'><q id='h17a72rm'></q></dir></style></legend>
                                  <tfoot id='735jzm4c'></tfoot>