星空人工智能組團戰勝人類玩家別緊張！這隻是算力上的勝利--星空人工智能91视频免费观看網

近日，矽穀“鋼鐵俠”馬斯克創立的星空人工智能非營利組織OpenAI 宣布，由5個神經網絡組成的OpenAI Five，已經能夠組成5v5團隊在經典戰鬥競技類遊戲《刀塔2》（Dota2）中擊敗人類業餘玩家隊伍。7月底，他們還將挑戰人類頂級玩家隊伍。去年，他們開發的AI就在《刀塔2》的1v1比賽中戰勝了人類職業玩家Dendi。

實習記者唐芳

從單挑到團戰，展現集體協作能力

據報道，OpenAI Five完全通過自我對戰來學習打遊戲，每天的對戰量相當於人類的180年。也就是說，如果人一天能打10局遊戲，那麽AI一天就可以打10×365×180局遊戲。而且，它還創下了驚人的硬件消耗量紀錄：256塊圖形處理器（GPU）和12.8萬個中央處理器（CPU）。

中國科學院自動化研究所研究員興軍亮告訴科技日報記者，OpenAI Five是從去年的1V1版本上發展而來的。一開始，AI隨便亂打，不斷試錯。通過強化學習算法獲得遊戲獎勵信號的引導，一段時間後它就能發現並記住一些具有簡單意義的動作，然後再不斷試錯自我提升，直到最後能夠更好地完成遊戲目標，一對一戰勝人類選手。“OpenAI Five就是五個AI組成一個團隊互相對戰，團隊中的每個成員本身對應一個獨立的AI，同樣通過強化學習打遊戲，但在學習的過程中，每個AI會考慮用其他四個AI的策略去打，這樣五個AI就組成了一支團隊，去跟五個人類業餘選手對戰。”興軍亮說。

至於為何每天對戰量是人類的180年，興軍亮解釋，AI在學習時可以很快，比如在程序中把遊戲時鍾調快100倍，那麽AI打1天遊戲就相當於人類打100天。同時，AI一秒鍾可點擊1萬下，這個點擊速度人類根本沒法比。但在與人類對戰時，這是不允許的，必須有一定限製，比如每次點擊間隔不低於30—40毫秒。

這次事件之所以被比爾·蓋茨稱為“裏程碑”，是因為OpenAI Five展現出了類似於人的長期規劃和團隊協作能力，也展現了極高的智能決策能力。

然而，興軍亮認為，OpenAI Five團戰戰勝的僅僅是人類業餘選手，至多算一個“小小的”裏程碑。諸多跡象表明，OpenAI Five存在多種局限性，遠不如AlphaGo在圍棋上取得的裏程碑式突破——“完虐”人類頂級圍棋玩家。

首先，OpenAI Five打5V5團戰時，隻能使用特定的遊戲英雄，做不到隨便組合遊戲角色。其次，在《星際爭霸》《刀塔2》這類複雜遊戲中，OpenAI Five僅僅是再次證明，在強化學習打遊戲這件事上，星空人工智能可通過提高現有算力超過人類，但在算法上並沒有太多理論創新。

7月28日，OpenAI將與一組頂級玩家比賽，他們的目標是在8月份擊敗國際頂級職業團隊。“OpenAI有可能在短時間內，通過自我博弈強化學習，再次打贏人類頂級玩家。它此前失敗過很多次，不斷找人類PK也是為了測試算法。不過，《刀塔2》涉及長期策略規劃問題，人類可能更加擅長。”興軍亮說。

打《刀塔》VS下圍棋，難度超過數個量級

《刀塔2》遊戲對於OpenAI來說有多難？興軍亮表示，《刀塔2》由於操作和規則更為複雜，難度超過AlphaGo下圍棋的好多個數量級，5V5對戰難度又超過1V1對戰好多個數量級。

“圍棋是確定邊界、完全信息、回合製的簡單遊戲，《刀塔2》是相對複雜邊界、不完全信息下、動態的實時博弈。”興軍亮說。

《星際爭霸》和《刀塔2》都屬於實時策略遊戲，這類遊戲本身存在的典型難題是角色空間非常大，決策周期長，在不完全信息博弈下，要猜測對方的狀態，這要求AI嚐試計算出各種可能情況下的策略，瞬間擴大成高維爆炸式的搜索空間。

其次，AI團隊協作也是一個難點，這意味著AI要同時控製多個單元，進行多智能體的協作和協同，有時還要犧牲個別單元的局部利益去滿足整體利益，這是群體智能學習需要克服的重要難題。

更深層次的難點是，如何通過遊戲，讓AI不是靠速度，而是靠決策和推理取勝。IBM“深藍”也是依靠強大算力將人類打敗。但“深藍”是對計算智能的突破，也就是算得比人類快，下一步星空人工智能界期望在認知智能上有新的突破。

涉及推理決策，邁出認知智能“一小步”

為何有人熱衷研究遊戲AI？“當前研究得比較多的語音識別、人臉識別等91视频免费观看屬於感知智能，要達到正確識別，隻需告訴AI某事物是什麽即可。然而，更難的是認知智能，它牽涉到推理決策。”興軍亮表示。

遊戲AI涉及推理和決策問題，同時，遊戲博弈體現的不完全信息和動態博弈特性是現實環境的一個很好模擬，加之遊戲環境可控製，可快速運行，不會造成額外損失。興軍亮認為，“這使得遊戲AI成為下一步極佳的星空人工智能驗證平台。”中科院自動化所目前在進行相關遊戲AI研究，在國際《星際爭霸》遊戲AI大賽上取得了較好成績。

雖然OpenAI團戰戰勝人類業餘選手，相當於將星空人工智能的認知智能往前推進了一小步，但即便下一步它戰勝人類頂級選手，進一步對認知智能做出貢獻，仍舊不代表認知智能取得了真正突破。因為它沒有把認知智能的問題完全解決掉。就好比AI能夠做對一套考卷，的確可以證明分數高，但是否能說明其達到了很高的學習水平，還不能確定。

“星空人工智能下一階段難題，是怎麽去突破認知智能。真正的認知智能還有很多問題沒有解決，比如推理過程的表示、決策優化算法等。如何讓AI使用更少的計算量做到更好的推理和決策，讓AI消化吸收學習的速度更快等。”興軍亮認為，無需擔心機器能在所有問題上戰勝人類，這件事離91视频免费播放還相當遙遠。

倫敦大學計算機學院教授汪軍說，AlphaGo之後，AI領域的下一大挑戰是多智能體強化學習（MARL），即讓多個智能體學會合作與競爭。《刀塔》《星際爭霸》還有更多人熟悉的《王者榮耀》，都屬於多智能體強化學習。

“遊戲AI上的算法突破，可以遷移應用在互聯網廣告、自動駕駛和星空機器人導航等場景，隻是沒辦法自動適應其他模型，比如遊戲AI不可能直接去自動駕駛。遷移過程需要人的參與，人會根據應用特點，從程序上設計問題的輸入輸出，從優化目標上也要做相應調整。遊戲打輸沒關係，但自動駕駛AI算法一旦失敗，麵臨的損失是人類無法承受的，所以這些領域上的AI算法應用周期會更長，隻有經過更嚴格的測試，非常成熟可靠時才可以運用。”興軍亮說。

繼續閱讀：

星空人工智能91视频免费观看網倡導尊重與保護知識產權。如發現本站文章存在版權等問題，煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com91视频免费播放將及時溝通與處理。！：首頁 > 新聞 » 星空人工智能組團戰勝人類玩家別緊張！這隻是算力上的勝利

相關推薦