​(图源:来自网络)


Turochamp(最早的国际象棋程序)到DeepBlue(IBM开发的国际象棋AI),几十年来,人机对抗一直吸引着公众的眼球。近年来,人工智能(AI)系统开始在各种经典游戏中称霸。Google旗下的AI研发公司DeepMind在很多创新领域处于前沿地位。


(图源:来自网络)


2016年3月,有这样一场机器与人脑的较量,由DeepMind的AI系统AlphaGo对阵围棋传奇人物、18次世界冠军得主李世石。在全球数百万人的收看下,不可思议的一幕缓缓展开,AlphaGo以外科手术般的精准度挑开了这位可以说是过去十年来抽象策略棋牌游戏的最佳棋手。AlphaGo的惊人胜利为其人工智能系统赢得了9级的段位,这是目前围棋届认证的最高等级。


(图源:来自网络)

最近,Deepmind开始在另一款古老的策略桌游上训练人工智能。


这是一款叫《强权外交》的桌游。出版于1959年,是一款集哄骗,谈判,政治,战争为一体的策略桌游。


(图源:yihubg.com)


游戏在一幅欧洲地图上进行,这幅地图代表二十世纪初、一战以前的欧洲政治现状。一共分为七国:英国、法国、德国、意大利、奥匈帝国、俄罗斯、土耳其。就是说,《强权外交》会有七名玩家,并专注于在面对其他国家时建立联盟、谈判和团队合作。因此,国家之间必须不断推断与谁合作以及如何协调行动。"DeepMind的研究工程师Tom Eccles说。


(图源:来自网络)


每一回合之前有一段谈判时间,各国利用此时与其他国家沟通、合作或结盟。凭着一国的实力想要独自称霸欧洲是没有可能的,你必须与其他利益相同的强权合纵联横,对抗其他有利害冲突的国家。欺骗、背叛与出卖在本游戏中都是被许可的,你无须要为自己的承诺负任何责任。当然你必须要顾虑到自己的诚信,一个有多次背信记录的国家可能会引起其他国家的戒心,甚至敌意。


和其他的游戏不同,《强权外交》涉及到复杂的战略和谋划水平。例如,在像跳棋这样的游戏中,棋手对于在任何特定时间将单个棋子移动到哪里的决定权相当有限。当然,国际象棋的细微差别和复杂性会增加,因为棋手必须给棋子赋予价值,并为成功走出一连串有策略的回合。


《强权外交》对AI提出了一系列新的挑战。
事实证明,在象棋、围棋等无平局游戏中,人工智能系统甚至远胜于最好的人类。在这种类型的游戏中,只能有一个赢家和一个输家。不同的是,《强权外交》需要在国家之间建立联盟,促进协作。


一方面,如果没有其他国家的支持,很难在游戏中取得进步,但另一方面,只有一个国家可以最终获胜。这就意味着在这种环境下实现合作的难度更大。DeepMind的研究科学家Tom Anthony说:“《强权外交》中合作与竞争之间的紧张关系,使得在这个游戏中建立一个值得信赖的AI国家成为一个有趣的研究挑战。”


需要注意的是,这项研究的重点是理解 “多国环境 "中的互动,目前的研究使用了《强权外交》的改编版本——一个无压力版本的游戏玩法,该版本不允许交流。进一步的研究和开发将允许未来的AI国家参与完整的外交游戏,利用沟通来建立联盟并与其他玩家进行谈判。


在《强权外交》的完整版本中,"通信被用来促成交易和组建联盟,但也可以用来歪曲情况和意图"。在这样的一种情况下,“AI国家需要学会建立信任,但也可能需要利用这种信任来误导他们的合作玩家,并获得优势。"

“我们的出发点是,所有的人工智能应用都应该保持在有意义的人类控制之下,并用于对社会有益的目的。我们从事技术安全和伦理工作的团队旨在确保我们不断预测短期和长期风险,探索防止这些风险发生的方法,并在风险发生时找到解决的方法。”Tom Anthony说。


相比于围棋这类抽象桌游的纯计算比拼,《强权外交》显然更加动态和复杂。这不禁让小编思考,在遥远的未来,如果国与国之间都是靠AI来外交的话...世界会更好吗?