LLM的相关内容 - 漫话开发者

2025-02-24 talkingdev

STeCa框架：提升LLM Agents在长期任务中的表现

近日，研究人员推出了一种名为STeCa的创新框架，旨在通过自动识别和纠正次优行动来提升LLM Agents在长期任务中的表现。该框架的核心在于其能够对LLM Agents的每一步行动进行校准，从而确保在复杂的长期任务中，每一...

2025-02-23 talkingdev

近日，一项关于如何仅用四个数字2构造任意整数的数学挑战在技术圈引发广泛讨论。该问题不仅考验数学家的创造力，也为算法设计和逻辑推理提供了新的思路。通过结合数学运算符、括号以及指数等工具，参与者可以尝试构...

2025-02-21 talkingdev

梁文峰，一位对冲基金经理，推出了自筹资金的开源AI平台DeepSeek，该平台因其创新的LLM（如DeepSeek-R1）而迅速获得全球关注，这些模型可与OpenAI的模型相媲美。DeepSeek采用更具成本效益的训练方法，并兼容消费级硬...

2025-02-21 talkingdev

在LLM的预训练过程中，网络爬虫获取的数据往往因文本提取效率低下而被大量丢弃。然而，近期一项开源项目在GitHub上发布，显著提升了文档的保存率，并利用这些数据在少量爬取内容的基础上训练出更强大的模型。该项目...

2025-02-21 talkingdev

近日，LLM-Oasis作为一个大规模数据集正式发布，旨在为训练和评估系统提供支持，以检测和提升LLM（大语言模型）输出的事实性。随着LLM在自然语言处理领域的广泛应用，其生成内容的准确性和可靠性成为业界关注的焦点...

2025-02-20 talkingdev

近日，BadSeek项目揭示了如何在大型语言模型（LLM）中植入后门的技术细节。该项目通过深入研究LLM的embedding机制，展示了如何在不影响模型整体性能的情况下，植入特定的触发机制，从而在特定条件下激活后门功能。这...

2025-02-20 talkingdev

近日，一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中，成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力，也为LLM和agent...

2025-02-19 talkingdev

近日，Gatsby的开发者团队宣布推出了一款全新的开源JavaScript agent框架——Mastra。该框架旨在为开发者提供一个高效、灵活的工具，以简化复杂agent系统的构建过程。Mastra不仅支持LLM、embedding等先进技术的集成，...