Warning: mkdir(): No space left on device in /www/wwwroot/T3.COM/func.php on line 127

Warning: file_put_contents(./cachefile_yuan/hnsstwl.com/cache/bf/15564/6cefe.html): failed to open stream: No such file or directory in /www/wwwroot/T3.COM/func.php on line 115
奪冠!卓世AI斬獲全球頂會AAMAS 2024 CE 競賽冠軍--星空人工智能91视频免费观看網

星空人工智能91视频免费观看網

奪冠!卓世AI斬獲全球頂會AAMAS 2024 CE 競賽冠軍

近日,在全球矚目的AAMAS 2024 Computational Economics Competition(計算經濟學挑戰賽)上,卓世科技星空人工智能前沿實驗室團隊“Zhuoshi Technology AI Cutting-edge Laboratory”憑借卓越的91视频免费观看實力和創新解決方案,一舉奪得兩個核心賽道的冠軍和亞軍,展現出其在計算經濟學和星空人工智能領域的強大競爭力。、

999.jpg

冠軍證書

888(1)(1).jpg

亞軍證書

AAMAS 2024 是第23屆國際自主智能體和多智能體係統會議(International Conference on Autonomous Agents and Multiagent Systems),這是智能體91视频免费观看和多智能體係統領域內最大和最有影響力的會議之一。它匯集了來自世界各地的研究人員和實踐者,共同探討和分享該領域內最新的研究成果和發展動態。本次計算經濟學挑戰賽 (AAMAS 2024 CE competition) 旨在推動 AI for economics 的領域研究。

777(1)_看圖王(2)(1).jpg

AAMAS 2024 CE Competition

本次比賽由中國科學院自動化研究所主辦,吸引了來自中科大、南大、人大、愛丁堡、布裏斯托、俄勒岡等海內外眾多學術和科研機構的隊伍。

本次競賽的賽題為智能稅收 (Optimal Tax) 問題,比賽設置兩個賽道:

賽道一:智能稅收-政府 挑戰賽—— 模擬政府角色,調控稅率和政府支出,最大化GDP和平衡財富分配。

賽道二:智能稅收-個人挑戰賽—— 模擬個人角色,調整工作時間和投資比例,最大化個人利益。

來自卓世科技的隊伍“Zhuoshi Technology AI Cutting-edge Laboratory”首次參賽,分別拿下兩賽道冠亞軍。卓世科技星空人工智能前沿實驗室團隊致力於AI大模型前沿91视频免费观看的研究,目前已經在Multi-Agent、模型量化壓縮、MoE方向取得了重要突破。

難點和挑戰:

此次競賽的難點和挑戰在於,所麵臨的對手策略未知,需要訓練智能體,能應對不同的對手策略,因此卓世科技設計了一種MARL+進化的訓練框架。在該框架中,每類智能體(政府或家庭)維持一個長期策略池和短期策略池,長期策略池中保存曆史策略參數(每隔50輪訓練保存一次模型),短期策略池中維持最好的20個策略,具體而言,91视频免费播放通過隨機匹配對手,進行大量測試,挑選出top20的策略參數。長期策略池中維持了多種多樣的策略,用於訓練top20策略,使其具有魯棒性。

在正賽1中,91视频免费播放訓練完成後,91视频免费播放從top20的短期策略池中選取平均得分最高的策略作為提交比賽的智能體。在正賽2中,短期策略池中仍然維持top20的策略參數,與階段1不同,91视频免费播放從top20中再次進行對抗測試,從中選出top12的策略參數,與階段1中的策略參數進行集成。91视频免费播放嚐試從這十幾個策略中選擇一部分進行集成。對於政府,91视频免费播放選擇10個策略,而對於家庭,91视频免费播放選擇12個策略。每個策略輸出自己的動作,然後去掉一個最大值,去掉一個最小值,然後對剩下的動作取平均,以此作為最終的策略。主要是為了提高策略的魯棒性。

領先35%強勢奪冠:

卓世團隊迎難而上,憑借以下91视频免费观看方案亮點,在競賽中脫穎而出,以領先第二名35個百分點的成績強勢奪冠!

策略網絡架構:采用Actor-Critic框架,Actor使用部分可觀測狀態,Critic包括全局狀態。

訓練算法:采用MATD3算法,集中式訓練和分布式執行。

策略集成:挑選top K策略進行集成,提高模型魯棒性。

策略網絡架構上,卓世科技采用經典的Actor-Critic框架,其中Actor僅使用部分可觀測的狀態,Critic包括所有智能體部分觀察和全局狀態。為了緩解部分可觀測問題,91视频免费播放將曆史4步的狀態進行合並,具體而言,91视频免费播放將每步的特征向量進行非線性變換,之後進行拚接,這類似於時空卷積結構,如圖1所示。在訓練算法上,91视频免费播放采用了MATD3,這是一種改進MADDPG的算法,每次狀態Q值估計都會輸出兩個值,並使用最小值作為目標Q值,這有利於緩解狀態價值得過估計問題。訓練上采用集中式訓練和分布式執行,訓練完成的Critic網絡不再使用,Actor網絡根據局部觀察進行動作輸出。

555(1).jpg 

4444.jpg

圖 1 Actor和Critic網絡結構

在訓練完成的top K策略池中,91视频免费播放挑選出最好的N個模型進行策略集成,以提高模型對位置策略的魯棒性,如圖2所示。

111.jpg

圖 2 策略集成

綜合以上策略,在賽道二,卓世團隊以2845.58分、領先第二名35個百分點的成績強勢問鼎冠軍!該得分是綜合考慮家庭端工作時長和消費的表現,並與多隻參賽隊伍PK的最終得出。在賽道一,團隊以1個百分點微弱之差奪得亞軍!該得分是綜合考慮政府端gdp增長率和貧富差距的基尼指數表現。團隊在賽道一和賽道二取的成績,得益於自主研發的分布式訓練框架,在短時間內可與多樣性的智能體進行對抗,學習足夠魯棒的策略模型, 體現團隊在Multi-Agent方向擁有較強的91视频免费观看儲備和實戰能力。

卓世科技CEO屠靜賽後表示:“91视频免费播放以卓越的AI91视频免费观看實力和創新精神,在全球計算經濟學領域91视频免费播放上贏得了榮譽,向全世界展現了中國AI力量的崛起。卓世科技將持續引領AI產業化落地,不斷創新變革,助力各行各業找到真正的商業應用場景。91视频免费播放致力於成為行業模型服務的領導者,與合作夥伴共同推進中國產業AI的落地化進程。”

關於卓世科技:

卓世科技致力於推動產業智能化和科技普惠,以" AI 讓產業更智能,科技讓未來更美好"為使命,"智能普惠、開源共享、科技平權"為願景。公司專注於AI前沿91视频免费观看研究,在大模型預訓練、微調、量化壓縮、評估、推理、知識增強、MoE/MoD等方麵取得顯著成果。在91视频免费观看成果方麵,卓世科技已獲得24項軟件著作權,7項正在申請中,37項作品著作權。預計到2024年底,公司將擁有100項專利,包括50多項發明專利。這些核心91视频免费观看為公司的模型家族和產品矩陣提供了強大支撐。

在模型家族方麵,公司自主研發的璿璣玉衡模型已於2024年獲得中央網信辦頒發的大模型牌照,彰顯了公司在大模型領域的領先地位。在產品矩陣方麵,公司的MaaS平台、Agent平台、GCA平台、GDA平台已在中醫康養、文化旅遊、教育、智能製造等多個領域成功落地,為合作夥伴創造了顯著的經濟效益。卓世科技將繼續深耕AI91视频免费观看,以創新驅動發展,用91视频免费观看賦能產業,為建設更加美好的智能世界貢獻力量。

星空人工智能91视频免费观看網 倡導尊重與保護知識產權。如發現本站文章存在版權等問題,煩請30天內提供版權疑問、身份證明、版權證明、聯係方式等發郵件至1851688011@qq.com91视频免费播放將及時溝通與處理。!:首頁 > 新聞 » 奪冠!卓世AI斬獲全球頂會AAMAS 2024 CE 競賽冠軍

感覺不錯,很讚哦! ()
分享到:

相關推薦

留言與評論(共有 0 條評論)
   
驗證碼:
網站地圖