天桥脑科学研究院的OMNE长效记忆框架在GAIA排行榜中位居榜首


红木城,2024年10月23日。 凭借对大脑和记忆的深刻理解,天桥脑科学研究院的内部AI团队在人工智能领域取得了重大突破,其自主研发的OMNE多智能体框架在Hugging Face发布的GAIA(通用AI助手)基准排行榜(https://huggingface.co/spaces/gaia-benchmark/leaderboard)中占据了榜首。OMNE超越了包括微软研究院在内的一些全球顶尖机构的框架。这一成就建立在TCCI多年的脑科学研究基础上,使智能体具备了长效记忆(LTM)能力,从而使该框架能够进行更深入、更缓慢的思考,并增强大语言模型(LLM)在复杂问题解决中的决策能力。

自从研究院创始人、前中国科技巨头陈天桥在去年宣布“全力投入AI战略”以来,这一里程碑成为TCCI AI团队的一项重大成就。

OMNE目前的总体成功率为40.53%,超越了来自Meta、微软、Hugging Face、普林斯顿大学、香港大学、英国AI安全研究所和百川等知名机构的提交结果。相比之下,配备插件的GPT-4的成功率仅为15%。

由Meta AI、Hugging Face和AutoGPT共同推出的GAIA是一个基准测试系统,旨在对AI助手在现实世界中的挑战进行严格测试。它评估诸如推理、多智能体协作、网络浏览和工具使用等核心能力。作为对多智能体智能最具挑战性的数据集之一,登顶GAIA排行榜展示了盛大在AI技术方面的深厚实力及其推动创新边界的能力。

OMNE是一个基于长效记忆(LTM)的多智能体协作框架。每个智能体具有相同且独立的系统结构,能够自主学习并理解完整的世界模型,从而独立地理解环境。基于LTM的多智能体协作系统使AI系统能够实时适应个体行为变化,优化任务规划与执行,并促进个性化和高效的自我进化。

这一重大突破在于集成了长效记忆机制,大大减少了蒙特卡洛树搜索(MCTS)的搜索空间,并提升了在复杂问题上的决策能力。 通过引入更高效的逻辑推理,OMNE不仅提升了单个智能体的智能水平,还通过优化协作机制显著增强了多智能体系统的整体能力。该增强机制的灵感来源于对人类大脑皮层柱状结构的研究。作为大脑认知和行为功能的基本单元,皮层柱通过复杂的协作机制实现信息处理。通过加强单一智能体与其他智能体之间的协作,AI模型可能逐渐产生认知能力的涌现,构建内部表征模型,从而推动系统整体智能的飞跃。

“看到OMNE位居GAIA排行榜榜首,我们感到非常自豪,”TCCI AI团队负责人表示。“这一成就展示了利用长效记忆驱动AI自我进化并解决现实问题的巨大潜力。我们相信,推进长效记忆和AI自我进化的研究对于AI技术的持续发展和实际应用至关重要。”

关于天桥脑科学研究院

天桥脑科学研究院由陈天桥和他的妻子雒芊芊于2016年创立,承诺投入10亿美元以推动脑科学的发展。该组织的愿景是通过理解大脑如何感知、学习和与世界互动来改善人类体验。

天桥脑科学研究院于2016年在加州理工学院创建了天桥脑科学研究院神经科学研究所,并于2017年与上海周良辅医学发展基金会、华山医院和上海精神卫生中心合作成立了陈天桥转化研究院。2020年,天桥脑科学研究院开设了陈氏前沿实验室应用神经技术实验室,2021年又成立了陈氏前沿实验室人工智能与心理健康研究所。2023年初,天桥脑科学研究院启动了陈氏学者计划,以支持处于早期到中期职业发展的医学科学家。研究院高度关注人工智能,因为其能够加速科学研究的进程。

了解有关天桥脑科学研究院和人工智能加速研究科学奖的信息,请访问 ChenInstitute.org/Prize 并关注我们的新闻动态,访问ChenInstitute.org, LinkedIn, 或通过 X @ChenInstitute.

如需了解更多信息,请联系我们: contactus@cheninstitute.org

有关GAIA基准测试的更多信息,请访问:[GAIA Benchmark Results]https://huggingface.co/spaces/gaia-benchmark/leaderboard

天桥脑科学研究院关于AI长效记忆的论文《长效记忆:AI自我进化的基础》已在arXiv上发布: https://arxiv.org/abs/2410.15665