大模型的相关内容 - 漫话开发者

2026-05-20 talkingdev

AI2发布OlmoEarth v1.1：行星级遥感分析成本骤降3倍，性能不变

艾伦人工智能研究所（Ai2）最新发布的OlmoEarth v1.1模型家族，在遥感智能分析领域实现了显著的成本突破。该系列模型通过创新的序列长度优化技术，将处理遥感数据的计算成本最高降低至原来的三分之一（即3倍效率提升...

2026-05-19 talkingdev

一项最新研究揭示了语言模型在预训练过程中的一个惊人现象：它们并非平稳地提升能力，而是在“模仿”和“智能行为”之间突然切换，研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术（如调整学...

2026-05-19 talkingdev

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示，该模型的政治审查并非根植于其预训练阶段获取的事实性知识，而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现，模型本身并未“...

2026-05-19 talkingdev

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版，涵盖文本和视觉两大核心能力。据悉，Qwen3.7 Max Preview在文本竞技场中位列第13名，而Qwen3.7 Plus Preview则在视觉竞技场中排名第16，显示出阿里在大...

2026-05-14 talkingdev

OpenAI 近日详细披露了其 Codex 功能在 Windows 系统上运行背后的工程挑战与解决方案。为了在保证安全性的前提下，让编程 AI 代理能够高效地在本地开发者机器上执行任务，OpenAI 构建了一套高度受限的“Windows 沙箱”...

2026-05-14 talkingdev

Anthropic近日正式发布了面向中小企业的AI解决方案——Claude for Small Business。该产品并非单一的聊天界面，而是一套精心设计的连接器与工作流集合，旨在将强大的Claude模型无缝嵌入中小企业日常使用的关键软件生态...

2026-05-13 talkingdev

大型语言模型的部署成本一直是其广泛应用的主要障碍之一。一篇来自AlphaXiv的最新研究提出了一种创新解决方案：通过强化学习微调递归语言模型（RLMs）。该方法的核心在于训练一个共享的策略，同时驱动父模型和子模型...

2026-05-12 talkingdev

在AI大模型推理成本与日俱增的背景下，测试时扩展（Test-Time Scaling）正成为提升模型性能的前沿方向之一。近日，来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架，旨在通过编码Agent在回放环境中迭...