一项针对大语言模型(LLM)记忆更新机制的研究揭示了令人意外的结果:当AI代理不断通过LLM更新其长期记忆时,不仅未能提升性能,反而可能导致表现下降,甚至不如完全没有记忆功能的模型。研究者指出,问题核心在于“...
Read More在大型语言模型领域,一种新的视角正在引发讨论:将上下文视为“软件”,而将权重视为“硬件”。这种比喻揭示了模型运作的本质差异。上下文(如KV缓存)动态地调节模型的激活值,为特定任务提供临时性的“编程”,从而实现...
Read More近日,一个名为Letta Code的开源项目在GitHub上发布,它代表了一种新型AI编程代理的设计范式。该项目旨在构建一个“记忆优先”的编程框架,专为能够跨会话持久存在的长期智能体而设计。与传统的、每次对话都从零开始的...
Read More近日,一个名为Hippo Memory的开源项目在GitHub上发布,旨在为AI智能体构建一个受生物学启发的记忆系统,以解决其在长期交互中遗忘关键上下文信息的核心难题。该项目灵感来源于人类大脑中的海马体,通过模拟记忆衰减...
Read More近日,一项名为“LLM Wiki”的创新框架在开发者社区引发关注。该框架的核心是一个可被复制并粘贴到大语言模型(LLM)智能体中的“想法文件”,旨在为利用LLM构建和维护知识库提供一套系统化模式。在这一协作框架下,人类...
Read More近日,由vectorize-io团队在GitHub上开源的项目Hindsight引发了人工智能领域,特别是智能体(Agent)开发社区的广泛关注。该项目旨在解决当前AI智能体在长期任务和复杂交互中面临的核心挑战——记忆管理。Hindsight的...
Read More近日,AI领域知名专家、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目,并将其描述为一个“灵感文件”(idea file)的范例。该项目迅速在技术社区引发关注...
Read More近日,一个名为ATLAS(Adaptive Test-time Learning and Autonomous Specialization)的开源项目在开发者社区引发广泛关注。根据Hacker News上的讨论,该项目展示了一项引人瞩目的性能表现:在特定的编码基准测试中...
Read More