漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-01-27 talkingdev

开源|SWE-Pruner:代码智能体上下文剪枝框架,令牌消耗锐减超50%

近日,GitHub开源项目SWE-Pruner提出了一种名为‘任务感知上下文剪枝’的创新框架,旨在显著优化代码智能体(Coding Agents)在处理复杂软件工程任务时的效率与成本。该框架的核心在于,通过一个轻量级模型动态分析与...

Read More
2026-01-05 talkingdev

开源|HGMem:超图工作记忆框架提升LLM复杂关系推理能力

近日,一个名为HGMem的开源项目在GitHub上发布,该项目实现了一篇题为《Improving Multi-step RAG with Hypergraph-based Memory for Long-context Complex Relational Modeling》的论文。HGMem是一个基于超图的工作...

Read More
2026-01-01 talkingdev

开源|E2E:基于JAX的端到端测试时训练框架,革新长上下文语言建模

近日,GitHub上开源了一个名为E2E的JAX官方实现项目,它提出了一种创新的长上下文语言建模方法。该方法的核心在于将传统的语言建模任务重新定义为持续学习问题。E2E模型采用标准的Transformer架构,并配合滑动窗口注...

Read More
2026-01-01 talkingdev

开源|LMCache:为LLM服务注入极速KV缓存层,响应速度提升3-10倍

近日,一个名为LMCache的开源项目在GitHub上发布,旨在通过创新的键值(KV)缓存加速层,显著提升大型语言模型(LLM)的服务性能。该项目专为LLM推理服务设计,其核心在于能够跨GPU、CPU、本地磁盘和Redis等多种存储...

Read More
2025-12-17 talkingdev

开源|通义千问推出Qwen-Doc项目,专注长文档理解与智能解析

阿里云通义千问团队近日在GitHub上开源了Qwen-Doc项目,这是一个专注于文档人工智能(Document AI)的开源计划。该项目旨在通过提供先进的模型和工具集,显著提升AI系统对长上下文文档的理解、解析能力,并支持基于...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体设计的顶尖前沿模型

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2,该模型被定位为专为专业知识工作和长期运行的智能体(agents)而设计的最先进系统。根据官方介绍,GPT-5.2在多个关键领域树立了新的性能标杆,包括代码生...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体优化的前沿模型

OpenAI正式推出其新一代前沿模型GPT-5.2,该模型被定位为专为专业工作场景和长期运行的智能体(agent)工作流而优化的最先进模型。相较于前代,GPT-5.2在多个关键维度实现了显著提升:其一,在知识工作领域,模型展...

Read More
2025-12-10 talkingdev

开源|智谱AI发布GLM-4.6V系列多模态大模型:原生工具调用与128K上下文窗口

智谱AI近日正式开源了其新一代多模态大模型系列——GLM-4.6V。该系列包含两个关键版本:GLM-4.6V(106B)和GLM-4.6V-Flash(9B)。前者是面向云端和高性能集群场景设计的基础模型,后者则是为本地部署和低延迟应用优化...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page