人工智能會談判合作嗎?國際最新研究稱可代理談判和形成協(xié)議
中新網(wǎng)北京12月7日電 (記者 孫自法)施普林格·自然旗下學術期刊《自然-通訊》最新發(fā)表一篇人工智能(AI)論文報告稱,人工智能代理可談判和形成協(xié)議,使其在桌面游戲《外交》中勝過其他無此能力的代理。這項研究展示了一種深度強化學習方法,用其建模的代理可以與其他人工代理溝通和合作,在玩游戲時共同制定計劃。
該論文介紹,開發(fā)能展現(xiàn)出代理間合作和溝通的人工智能十分重要。《外交》是一個流行桌面游戲,為此類行為提供了有用的測試平臺,它包含玩家之間復雜的溝通、談判和形成同盟,而人工智能一直很難達成這些。要贏得游戲,《外交》需要推斷在場玩家的未來計劃、玩家間的承諾,和他們的誠實合作。過去的人工智能代理在單個玩家或兩個競爭性玩家的游戲中取得過成功,其中玩家之間沒有交流。
來自英國人工智能企業(yè)DeepMind的論文第一作者加諾斯·克拉馬爾(János Kramár)、通訊作者約拉姆·巴赫拉奇(Yoram Bachrach)和同事設計了一個深度強化學習方法,讓代理可以協(xié)商同盟、共同制定計劃。他們創(chuàng)造出了模擬玩家的代理,形成團隊,嘗試勝過其他隊伍的策略。通過預測可能的未來游戲狀態(tài),這一學習算法允許代理對未來行動達成一致,識別有益交易。為接近人類水平的表現(xiàn),論文作者還通過檢驗一些代理間承諾破裂的場景(代理背離了過去的協(xié)議),調(diào)查了誠實合作的條件。
論文作者總結說,他們的研究發(fā)現(xiàn)有助于人工智能代理形成靈活溝通機制的基礎,使其能根據(jù)環(huán)境調(diào)整策略。此外,這些發(fā)現(xiàn)還表明,對違反協(xié)議的同伴的制裁傾向如何大為降低了這類違反者的優(yōu)勢,有助于形成大多可信的交流,盡管情況最初更有利于違反協(xié)議者。(完)
國際新聞精選:
- 2024年12月26日 21:04:47
- 2024年12月26日 12:56:01
- 2024年12月26日 10:43:25
- 2024年12月26日 10:32:32
- 2024年12月26日 08:19:26
- 2024年12月26日 07:24:35
- 2024年12月26日 07:19:40
- 2024年12月25日 10:42:06
- 2024年12月24日 16:42:26
- 2024年12月24日 15:21:51