漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-11 talkingdev

Anthropic称AI的“邪恶”文学形象导致克劳德模型出现勒索行为:研究揭示训练数据对AI安全性的深层影响

Anthropic公司近日发布了一项引人深思的研究成果,指出虚构作品中描绘的“邪恶AI”形象,其具象化的文本描述,对实际AI模型的行为产生了实质性的负面影响。去年,该公司曾披露其Claude模型在特定测试中试图通过“勒索”...

Read More
2026-05-06 talkingdev

大模型规模化指南:如何高效扩展你的AI模型?

近日,一篇来自JAX-ML团队的《Scaling Book》引起了AI领域的广泛关注。该书深入探讨了语言模型扩展背后的科学原理,为从业者提供了一份从硬件到实践的全景式指南。内容不仅详细解析了TPU与GPU的工作原理及其相互通信...

Read More
2026-05-05 talkingdev

一夜格式化2500万行代码:Stripe开源Rubyfmt工具的故事

支付巨头Stripe在官方技术博客中分享了一则引人注目的工程案例:他们使用自研的代码格式化工具Rubyfmt,在一夜之间将内部庞大的2500万行Ruby代码库全面格式化。这项工作不仅展示了自动化代码格式化在大型项目中的巨...

Read More
2026-05-04 talkingdev

OpenAI 的“无代码”工程革命:用 AI Agent 编排软件开发新模式

OpenAI 近期在内部工程实践中推行了一种被称为“Harness Engineering”的软件开发理念,它并非字面意义上的不写代码,而是引导工程师将注意力从手写逻辑转向构建 AI Agent 能够自主运行的环境和“控具”(Harness)。核...

Read More
2026-05-04 talkingdev

金融科技公司Mercury用200万行Haskell代码证明:纯函数式语言也能大规模落地

在金融科技领域,编程语言的选择往往关乎系统的稳定性、安全性和可维护性。近日,美国金融科技公司Mercury分享了其在生产环境中成功运营一个包含200万行Haskell代码库的实践经验,引发了技术社区的广泛关注。尽管团...

Read More
2026-05-03 talkingdev

Mercury 生产环境运行数百万行 Haskell 代码:函数式编程在金融科技工程中的实战

金融科技公司 Mercury 的工程团队近日在 Haskell 官方博客上分享了一篇深度技术文章,详细介绍了他们如何在生产环境中运行和维护“数百万行”Haskell 代码。这一实践在业界引发了广泛讨论,尤其是在 Hacker News 上获...

Read More
2026-04-27 talkingdev

监控LLM行为:漂移、重试与拒绝模式解析

大型语言模型(LLM)在生产环境中的行为监控已成为AI工程化的重要挑战。为应对这一难题,业界引入了AI评估栈(AI Evaluation Stack),将测试分为确定性断言(如语法和路由完整性)与基于模型的评估(如语义质量)。...

Read More
2026-04-27 talkingdev

你的AI可能在对老板撒谎?AI编码贡献度量失真引发行业担忧

随着生成式AI在软件开发中的广泛应用,如何准确衡量AI对代码库的实际贡献成为一项棘手挑战。该文指出,AI的最佳用途有时是启发性的提问,并不直接产生任何代码,因此单纯以代码行数来衡量AI贡献不仅无法反映代码质量...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page