加利福尼亞州雷德伍德城2024年10月30日 /美通社/ -- 陳天橋雒芊芊腦科學(xué)研究院(TCCI)內(nèi)部人工智能團隊?wèi){借對大腦和記憶的深刻理解,在人工智能領(lǐng)域取得了重大突破。他們自主研發(fā)的OMNE多智能體框架在GAIA(通用人工智能助手)基準(zhǔn)測試排行榜(https://huggingface.co/spaces/gaia-benchmark/leaderboard)上奪得首位,該排行榜由Meta AI、Hugging Face和Hugging Face的AutoGPT共同發(fā)起。 OMNE的表現(xiàn)優(yōu)于包括微軟研究院(Microsoft Research)在內(nèi)的一些世界領(lǐng)先機構(gòu)的框架。 這一成就基于TCCI多年的大腦研究成果,賦予智能體長期記憶(LTM)能力,使得框架能夠進行更深層次、更緩慢的思考,并在復(fù)雜問題解決中增強大型語言模型(LLM)的決策能力。
這一里程碑是自該研究院創(chuàng)始人、前中國科技巨頭陳天橋去年宣布"All-In AI戰(zhàn)略"以來,TCCI人工智能團隊的一項重大成就。
OMNE目前的總體成功率達到40.53%,在性能上超過了Meta、微軟、Hugging Face、普林斯頓大學(xué)、香港大學(xué)、英國人工智能安全研究所以及百川等提交的成果。 與此相比,配備插件的GPT-4的成功率僅為15%。
GAIA是多智能體智能領(lǐng)域中最嚴格的數(shù)據(jù)集之一,能夠在其排行榜上位居首位,彰顯了TCCI在人工智能領(lǐng)域的深厚專業(yè)知識以及拓展創(chuàng)新邊界的能力。
OMNE是一個基于長期記憶(LTM)的多智能體協(xié)作框架。 每個智能體具有相同且獨立的系統(tǒng)結(jié)構(gòu),能夠自主學(xué)習(xí)和理解完整的世界模型,從而獨立理解其環(huán)境。 基于LTM的多智能體協(xié)同系統(tǒng)使人工智能系統(tǒng)能夠?qū)崟r適應(yīng)個體行為變化,優(yōu)化任務(wù)規(guī)劃和執(zhí)行,促進個性化、高效的自我進化。
這一突破是長期記憶機制的融合,大大縮小了MCTS的搜索空間,提高了對復(fù)雜問題的決策能力。 通過引入更高效的邏輯推理,OMNE不僅提升了單個智能體的智能水平,還通過優(yōu)化協(xié)作機制顯著增強了多智能體系統(tǒng)的整體能力。 這種增強的靈感來自對人類大腦皮層柱狀結(jié)構(gòu)的研究。 作為大腦認知和行為功能的基本單位,皮質(zhì)柱通過復(fù)雜的協(xié)作機制實現(xiàn)信息處理。 通過加強單個智能體之間的協(xié)作,人工智能模型可能逐漸展現(xiàn)出認知能力,構(gòu)建起內(nèi)部表征模型,并最終推動系統(tǒng)整體智能的飛躍。
"我們對OMNE榮登GAIA排行榜榜首感到無比自豪。" TCCI人工智能團隊負責(zé)人表示。 "這一成就展示了利用長期記憶推動人工智能自我進化和解決現(xiàn)實世界問題的巨大潛力。 我們認為,推進長期記憶和人工智能自我進化的研究對于人工智能技術(shù)的持續(xù)發(fā)展和實際應(yīng)用至關(guān)重要。"