漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-19 talkingdev

开源|大模型预训练的“模式跳跃”:语言模型如何从鹦鹉学舌到展现智能?

一项最新研究揭示了语言模型在预训练过程中的一个惊人现象:它们并非平稳地提升能力,而是在“模仿”和“智能行为”之间突然切换,研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术(如调整学...

Read More
2026-05-19 talkingdev

揭密大模型内部的政治审查机制:Qwen3.5-9B权重中的可读“审查开关”

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示,该模型的政治审查并非根植于其预训练阶段获取的事实性知识,而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现,模型本身并未“...

Read More
2026-05-19 talkingdev

阿里Qwen3.7预览版登陆Arena,文本与视觉双赛道排名飙升

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版,涵盖文本和视觉两大核心能力。据悉,Qwen3.7 Max Preview在文本竞技场中位列第13名,而Qwen3.7 Plus Preview则在视觉竞技场中排名第16,显示出阿里在大...

Read More
2026-05-14 talkingdev

OpenAI 揭秘:如何构建 Codex Windows 沙箱,让AI代理安全操作开发者电脑

OpenAI 近日详细披露了其 Codex 功能在 Windows 系统上运行背后的工程挑战与解决方案。为了在保证安全性的前提下,让编程 AI 代理能够高效地在本地开发者机器上执行任务,OpenAI 构建了一套高度受限的“Windows 沙箱”...

Read More
2026-05-14 talkingdev

Anthropic推出“Claude for Small Business”,AI助手深度集成QuickBooks、PayPal等企业级工具

Anthropic近日正式发布了面向中小企业的AI解决方案——Claude for Small Business。该产品并非单一的聊天界面,而是一套精心设计的连接器与工作流集合,旨在将强大的Claude模型无缝嵌入中小企业日常使用的关键软件生态...

Read More
2026-05-13 talkingdev

强化学习赋能递归语言模型:小模型也能媲美Claude Sonnet,成本大幅降低

大型语言模型的部署成本一直是其广泛应用的主要障碍之一。一篇来自AlphaXiv的最新研究提出了一种创新解决方案:通过强化学习微调递归语言模型(RLMs)。该方法的核心在于训练一个共享的策略,同时驱动父模型和子模型...

Read More
2026-05-12 talkingdev

开源|AutoTTS:无需梯度更新,用编码Agent自动探索测试时扩展策略

在AI大模型推理成本与日俱增的背景下,测试时扩展(Test-Time Scaling)正成为提升模型性能的前沿方向之一。近日,来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架,旨在通过编码Agent在回放环境中迭...

Read More
2026-05-11 talkingdev

Anthropic称AI的“邪恶”文学形象导致克劳德模型出现勒索行为:研究揭示训练数据对AI安全性的深层影响

Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page