漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-02-21 talkingdev

Google Titans模型解析:内存驱动AI架构的未来

Google Titans模型是Google最新推出的一种内存驱动AI架构,旨在通过高效的内存管理和数据处理能力,提升AI模型的性能和效率。该模型的核心在于其独特的内存驱动设计,能够显著减少数据访问延迟,从而加速模型训练和...

Read More
2025-02-20 talkingdev

BadSeek揭示大型语言模型的后门植入方法

近日,BadSeek项目揭示了如何在大型语言模型(LLM)中植入后门的技术细节。该项目通过深入研究LLM的embedding机制,展示了如何在不影响模型整体性能的情况下,植入特定的触发机制,从而在特定条件下激活后门功能。这...

Read More
2025-02-20 talkingdev

论文:突破极限,单向量嵌入1568个Token的技术探索

近日,一项关于表示容量极限的研究引起了广泛关注。该研究尝试将尽可能多的Token嵌入到一个固定大小的向量中,成功实现了将1568个Token压缩至单一向量。这一突破不仅展示了embedding技术的强大潜力,也为LLM和agent...

Read More
2025-02-19 talkingdev

Mastra:Gatsby开发者推出开源JS agent框架

近日,Gatsby的开发者团队宣布推出了一款全新的开源JavaScript agent框架——Mastra。该框架旨在为开发者提供一个高效、灵活的工具,以简化复杂agent系统的构建过程。Mastra不仅支持LLM、embedding等先进技术的集成,...

Read More
2025-02-14 talkingdev

AI agent使用与滥用的检测技术引发关注

随着AI agent技术的快速发展,其应用场景日益广泛,但同时也带来了潜在的滥用风险。近期,业界开始聚焦于如何有效检测AI agent的使用与滥用行为。通过结合LLM、embedding、LoRA和RAG等先进技术,研究人员正在开发更...

Read More
2025-02-14 talkingdev

十年之后,失去的十年(2024)

2024年,科技行业回顾过去十年,发现许多机遇与挑战并存。尽管技术飞速发展,但在某些领域,我们似乎失去了宝贵的十年。从LLM的崛起到agent技术的广泛应用,再到embedding和LoRA的创新,技术的进步显而易见。然而,R...

Read More
2025-02-14 talkingdev

研究人员展示LLM在减少参数的同时保持学习能力

近日,研究人员通过优化技术展示了大型语言模型(LLMs)在减少非embedding参数的同时仍能保持学习能力。研究表明,通过用优化的子网络替换密集层,LLMs可以在减少高达77%的参数的情况下,依然保持与原有模型相当的性...

Read More
2025-02-13 talkingdev

MIT探索未来视觉技术:What if Eye...?

在最新的技术探索中,研究人员提出了一个引人深思的问题:What if Eye...? 这一问题不仅挑战了我们对视觉技术的传统认知,还开启了对未来视觉系统可能性的广泛讨论。通过结合先进的LLM和agent技术,科学家们正在开发...

Read More
2025-02-13 talkingdev

Page Assist开源:本地语言模型助力网页浏览

近日,GitHub上发布了一款名为Page Assist的新工具,旨在通过本地语言模型(LLM)提升网页浏览体验。Page Assist作为众多新兴工具之一,专注于利用本地化的语言处理能力,为用户提供更高效、个性化的网页浏览支持。...

Read More
2025-02-12 talkingdev

DeepMind提出新观点:Agency的测量需依赖参考框架

近日,DeepMind发布了一篇立场论文,探讨了如何衡量系统的“Agency”属性。论文指出,Agency的测量并非一个全局属性,而是依赖于特定的参考框架。这意味着,判断一个系统是否具有Agency,需要明确其所在的上下文和参考...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page