漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-08-25 talkingdev

短词元更易被选择:大语言模型输出偏差的新发现

最新研究表明,大语言模型存在系统性偏好短词元的倾向,这一发现对自然语言处理领域具有重要影响。由于短词元拥有更多可能的后续组合方式,模型可能会优先选择这些‘松散词元’,即使它们并非最佳语义选择。该研究进一...

Read More
2025-08-25 talkingdev

马斯克旗下xAI开源Grok 2.5模型权重,Grok 3预计半年后开放

埃隆·马斯克旗下人工智能公司xAI于近日正式在Hugging Face平台开源了其去年推出的旗舰模型Grok 2.5的模型权重。这一举措标志着xAI在推动AI技术透明化和社区协作方面迈出重要一步。Grok系列模型以其强大的多模态处理...

Read More
2025-08-24 talkingdev

突破性进展:研究者用CUDA C++实现5090光速级Flash Attention算法

近日,一项名为《Writing Speed-of-Light Flash Attention for 5090 in CUDA C++》的技术研究引发广泛关注。该研究通过CUDA C++实现了针对5090硬件的光速级Flash Attention算法,显著提升了注意力机制的计算效率。Fl...

Read More
2025-08-24 talkingdev

深度解析:Claude Code为何成为代码生成领域的性能标杆

近期,AI研究机构MinusX发布的技术分析报告《Decoding Claude Code》引发开发者社区广泛关注。该报告通过逆向工程和架构分析揭示了Anthropic公司开发的Claude代码生成模型的核心技术优势。报告指出,Claude采用创新...

Read More
2025-08-24 talkingdev

AGI是工程问题,而非模型训练问题?专家提出颠覆性观点

近日,技术专家Vinci Rufus在其博客提出引发业界热议的观点:实现通用人工智能(AGI)的核心挑战在于系统工程整合,而非单纯的模型训练。文章指出,当前大型语言模型(如GPT系列)虽在特定任务表现卓越,但距离真正...

Read More
2025-08-22 talkingdev

Sim开源:基于本地Ollama的AI智能体工作流构建部署平台

Sim作为一款新兴的开源平台,专注于AI智能体工作流的构建与部署,其核心突破在于深度整合Ollama框架,支持完全离线的本地AI模型运行。这一特性不仅显著降低了企业使用AI技术的云端依赖和数据传输风险,更通过开源模...

Read More
2025-08-22 talkingdev

AI产品开发迈入“概率时代”:从确定性软件到不确定性管理的范式转移

科技行业正在经历一场从确定性软件向概率性AI驱动的根本性转变。传统软件开发模式基于预定义功能和可测量漏斗的方法正在失效,因为AI模型展现出前所未有的涌现行为和不可预测性。企业必须采用实证科学的创新方法,通...

Read More
2025-08-22 talkingdev

PACT:对话议价基准测试集开放,揭示语言模型谈判能力

卡内基梅隆大学研究人员推出PACT(Pairwise Auction Conversation Testbed)对话议价基准测试平台,这是首个专门针对语言模型讨价还价能力构建的大规模评估体系。该平台包含超过5,000场对话博弈实验,每场包含20轮完...

Read More
  1. Prev Page
  2. 100
  3. 101
  4. 102
  5. Next Page