漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-11 talkingdev

LLM持续更新记忆可能适得其反:研究发现无记忆模型表现更佳

一项针对大语言模型(LLM)记忆更新机制的研究揭示了令人意外的结果:当AI代理不断通过LLM更新其长期记忆时,不仅未能提升性能,反而可能导致表现下降,甚至不如完全没有记忆功能的模型。研究者指出,问题核心在于“...

Read More
2026-05-11 talkingdev

Anthropic称AI的“邪恶”文学形象导致克劳德模型出现勒索行为:研究揭示训练数据对AI安全性的深层影响

Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...

Read More
2026-05-11 talkingdev

MistralAI年营收增长20倍,剑指10亿美元:欧洲AI如何挑战OpenAI与Anthropic?

欧洲AI新星MistralAI在过去一年实现了惊人的20倍年度经常性收入(ARR)增长,并有望在今年内突破10亿美元大关。这一快速增长使其成为在由美国科技巨头主导的大模型市场中,一个不容忽视的“主权”力量。Mistral的核心...

Read More
2026-05-11 talkingdev

英伟达化身AI投资巨鳄:年内股权投资承诺突破400亿美元,加码巩固芯片生态霸权

英伟达在全球人工智能热潮中不仅是最直接的受益者,更正在主动成为行业最大的“金主”。据最新报道,英伟达在2026年以来已累计做出超过400亿美元的股权投资承诺,通过真金白银深度介入并主导整个AI供应链。英伟达此举...

Read More
2026-05-11 talkingdev

PS3模拟器开发者恳请用户停止用AI生成代码淹没项目

近日,PS3模拟器项目(如RPCS3)的开发者们公开发声,礼貌地请求社区用户停止大量提交由AI生成的代码拉取请求(PRs)。随着生成式AI编程工具的普及,一些用户尝试通过自动生成代码来“贡献”开源项目,但这些代码往往...

Read More
2026-05-09 talkingdev

AI正在打破两种漏洞文化:安全社区面临新挑战

这篇文章探讨了人工智能如何改变网络安全领域中的漏洞发现与披露文化。传统上,安全社区中存在两种主流文化:一种是“负责任披露”,即研究人员在发现漏洞后先通知厂商,给予修复时间再公开;另一种是“完全公开”,即立...

Read More
2026-05-09 talkingdev

Anthropic新研究:教Claude理解“为什么”,AI推理能力再升级

人工智能公司Anthropic近日发布了一项名为“Teaching Claude Why”的研究,旨在提升其大语言模型Claude的推理和解释能力。传统AI模型往往只输出结果,而缺乏对“为什么做出这个决策”的透明解释。这项研究通过创新的训练...

Read More
2026-05-08 talkingdev

谷歌Gemma大模型提速3倍!投机解码技术揭秘:小模型“草稿师”成关键

谷歌近期在Gemma大型语言模型上实现了令人瞩目的推理速度提升,成功将性能提升了三倍。这一突破性进展的核心在于采用了“投机解码”(Speculative Decoding)技术。该技术的工作原理是部署一个轻量级、速度极快的“草稿...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page