冷扑大师”2.0不仅可以做人类玩家对手还可做队友
Libratus被研发出来后,在多次与人类玩家的对抗中,这款在大陆被称作“冷扑大师”的人工智能系统可谓已经“攻克了”无限德州扑克这项游戏,而根据外媒最新消息,如果研发团队这次能够成功把系统中有关合作的功能开发出来,这款AI会变得更强,堪称“冷扑2.0”。
2017年1月,卡纳基梅隆大学团队研发出来的Libratus(冷扑大师)让世人见识了它在扑克游戏的实力后,Jacob Crandal和他的团队想要在扑克AI系统身上开发出它的合作能力。
在接受外媒的采访时,Crandall解释说AI不应该像“冷扑大师”那样只懂得如何击败对手,当它面对一项任务时,它应该还要懂得和具备与人合作的能力。
Crandall研发团队将新的运算系统取名为S#,S#被用在“囚徒困境”这些游戏中进行测试,试验的目的是为了了解游戏中合作与妥协能够带来的价值。在测试的过程中,为了判断各方在游戏中的关系,他们会让计算机与计算机合作,人类玩家与人类玩家合作,还会让计算机与人类玩家合作。
在回顾各方在“囚徒困境”里的表现时,其实一个考察的关键就是看看参与者究竟是选择采取符合自身利益的行动,还是采取符合团队利益的行动。当选取采取符合自身利益的行动时,这些行动反而有可能会让自身的情况变得更糟糕的话,参与者所面临的两难境地就是,他究竟该不该去选择符合团队利益的行动,而让行动达到整体来说最好的效果。
Crandall告诉记者:“做这些测试的终极目标是去找到人类合作行为背后所隐含的定律,然后把它们运用到人工智能系统中,进而把AI的社交能力开发出来。”
用于测试的S#是没有说谎能力的,但研发团队会把一些我们看成是“空谈”的技巧输入系统中,当计算机检测到同伴合作的行为时,它就会给予积极的回应,可当它检测到同伴有不忠诚的行为出现时,它就会“说”出“你等着瞧”这种话。
实验的过程中,计算机学到的是团队合作的价值,学到的是合作所带来的好处,而当人类玩家并不知道自己是在跟S#合作时,他们的合作精神反而更强,这是他们在合作过程中接收到的积极回应所带来的直接结果。
Crandall的团队希望通过这项研究把人类在竞争环境下的关系理解得更透彻些,并将通过研究所得到的知识运用到AI的开发中,将AI研发成一款更具社交性的机器人。
“冷扑大师”的存在让我们看到了计算机在扑克这项零和博弈中优于人类的能力,而S#的出现则是为了将AI的功能上升到另一个高度,让它不仅能够优于人类,同时还能做人类的小伙伴,帮助人类在各种任务中达成最好的结果。
