漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-20 talkingdev

开源项目“僵尸化”危机:依赖项如何悄然成为技术负债

开源项目因维护者倦怠、资金短缺或技术老化而陷入“僵尸化”状态——虽仍被广泛使用,但已无人维护——正成为软件供应链中一个隐秘但巨大的风险。这一问题在开源生态中尤为突出,因为大量未被更新的软件包仍被各类应用依赖...

Read More
2026-05-20 talkingdev

AI2发布OlmoEarth v1.1:行星级遥感分析成本骤降3倍,性能不变

艾伦人工智能研究所(Ai2)最新发布的OlmoEarth v1.1模型家族,在遥感智能分析领域实现了显著的成本突破。该系列模型通过创新的序列长度优化技术,将处理遥感数据的计算成本最高降低至原来的三分之一(即3倍效率提升...

Read More
2026-05-20 talkingdev

开源| NVIDIA LongLive 1.0:实时长视频生成框架,支持流式注意力与交互式编辑

英伟达(NVIDIA)最新开源了LongLive 1.0框架,旨在解决长视频生成领域长期面临的实时交互难题。该框架通过引入流式注意力(Streaming Attention)和KV缓存优化(KV-cache optimization)技术,实现了对超长视频序列...

Read More
2026-05-19 talkingdev

开源|大模型预训练的“模式跳跃”:语言模型如何从鹦鹉学舌到展现智能?

一项最新研究揭示了语言模型在预训练过程中的一个惊人现象:它们并非平稳地提升能力,而是在“模仿”和“智能行为”之间突然切换,研究人员将其称为“模式跳跃”。这种非连续性的行为转变无法通过标准的优化技术(如调整学...

Read More
2026-05-19 talkingdev

开源|HRM-Text:1B参数文本生成模型,训练成本仅为传统模型的几百分之一

近日,一款名为HRM-Text的新型文本生成模型在GitHub上开源,引发了AI社区的广泛关注。该模型基于HRM架构,参数规模为10亿(1B),但其最大的亮点在于惊人的训练效率。据项目介绍,HRM-Text的训练所需的计算资源和数...

Read More
2026-05-19 talkingdev

揭密大模型内部的政治审查机制:Qwen3.5-9B权重中的可读“审查开关”

一项针对阿里通义千问Qwen3.5-9B模型的最新逆向分析揭示,该模型的政治审查并非根植于其预训练阶段获取的事实性知识,而是在知识层之上附加的一层独立、可识别甚至可移除的注意力电路。研究人员发现,模型本身并未“...

Read More
2026-05-19 talkingdev

Anthropic 收购 SDK 初创公司 Stainless,强化 AI 开发生态工具链

人工智能安全与研究公司 Anthropic 宣布收购开发者工具初创公司 Stainless。Stainless 专注于 SDK 自动化平台,其解决方案能够帮助开发者快速生成和维护高质量的软件开发工具包。该平台在 AI 行业中拥有广泛的用户基...

Read More
2026-05-19 talkingdev

Cursor 发布 Composer 2.5:强化学习加持的智能编码Agent,长时任务能力飞跃

著名AI编程工具Cursor近日正式发布了Composer 2.5版本。这是一款经过深度改进的代码生成Agent,其核心升级在于采用了目标导向的强化学习、合成数据生成以及全新的分布式训练技术。这一举措显著提升了AI在复杂、长周...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page