漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-06 talkingdev

论文推荐|Google重新定义AI幻觉:从“知识缺陷”转向“不确定性表达”

谷歌最新研究为人工智能领域的“幻觉”问题提供了一个颠覆性的理论框架。该论文指出,大语言模型(LLM)产生幻觉的核心并非传统认知中的“知识缺陷”或信息错误,而是模型在输出时未能有效表达其内在的不确定性。研究提...

Read More
2026-05-04 talkingdev

AI Agent的“缰绳”应该放在沙箱外?Mendral团队给出安全新解

随着AI Agent在复杂任务中的广泛应用,其核心控制机制——Agent Harness的架构设计正成为影响安全性和多用户协作效率的关键因素。Agent Harness本质上是驱动大语言模型(LLM)的控制循环,负责与外部环境交互、管理凭...

Read More
2026-04-29 talkingdev

Poolside发布Laguna系列编程模型:开源XS.2小而强,旗舰M.1专注长周期任务

人工智能编程领域迎来新玩家,初创公司Poolside正式发布Laguna系列编程模型,包含Laguna M.1与Laguna XS.2两款产品。其中Laguna M.1作为该系列的旗舰基础模型,专为长周期、复杂推理的编程任务设计(Long-horizon co...

Read More
2026-04-27 talkingdev

你的AI可能在对老板撒谎?AI编码贡献度量失真引发行业担忧

随着生成式AI在软件开发中的广泛应用,如何准确衡量AI对代码库的实际贡献成为一项棘手挑战。该文指出,AI的最佳用途有时是启发性的提问,并不直接产生任何代码,因此单纯以代码行数来衡量AI贡献不仅无法反映代码质量...

Read More
2026-04-22 talkingdev

OpenAI发布图像生成提示工程权威指南,助力开发者打造高可控性生产级视觉内容

OpenAI近期在其官方开发者平台发布了一份详尽的《图像生成模型提示工程指南》,这份长达38分钟的阅读材料,标志着生成式AI在图像创作领域正从实验性探索迈向成熟、可控的生产级应用。该指南系统性地阐述了如何通过精...

Read More
2026-04-20 talkingdev

OpenClaw的双面叙事:公众愿景与工程挑战并存,Anthropic携Claude Design进军设计领域

本周,Peter Steinberger的演讲揭示了OpenClaw项目呈现出的两种截然不同的叙事:一方面是鼓舞人心的公众愿景,另一方面则是工程师视角下对安全性与可扩展性挑战的严肃审视。与此同时,人工智能公司Anthropic正式推出...

Read More
2026-04-17 talkingdev

AI智能体Morphex深度进化:一年内自动提交数千PR,重构monday.com生产级单体架构

协作平台monday.com的工程团队近日披露了一项前沿技术实践:他们基于Anthropic的Claude Code SDK构建了一个名为Morphex的AI智能体,并将其直接部署在真实的生产代码库中进行了长达一年的“成长”实验。该智能体的核心...

Read More
2026-04-05 talkingdev

开源|LLM Wiki:从卡帕西的“灵感文件”看AI开发者的知识管理新范式

近日,AI领域知名专家、OpenAI联合创始人安德烈·卡帕西(Andrej Karpathy)在社交媒体上分享了一个名为“LLM Wiki”的GitHub Gist项目,并将其描述为一个“灵感文件”(idea file)的范例。该项目迅速在技术社区引发关注...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page