漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-06 talkingdev

OpenAI发布GPT-5.5 Instant:默认模型迎来事实准确性、幻觉抑制与个性化定制三重升级

OpenAI近日正式推出GPT-5.5 Instant,并已将其部署为ChatGPT的默认模型。这一更新并非单纯的参数规模提升,而是针对模型在实际应用中的关键痛点进行了重大优化。首先,新版模型在事实准确性上实现了显著飞跃,通过改...

Read More
2026-05-05 talkingdev

AI自我进化加速:研究自动化或将在2028年实现,机器经济时代即将到来

最新报告指出,人工智能正迅速迈向其自身研发(R&D)的全流程自动化。在编程、实验执行以及长期任务自主性方面,AI 已取得重大突破。基准测试显示,当前模型不仅能处理复杂的工程和科学工作流程,还能有效管理其他智...

Read More
2026-05-05 talkingdev

OpenAI披露低延迟语音AI全球架构:WebRTC分体中继与收发器模型成关键

OpenAI近日详细披露了其用于全球规模实时语音交互的低延迟基础设施架构。该架构基于重新设计的WebRTC协议,核心采用了分体中继(split relay)和收发器(transceiver)模型。通过将传统WebRTC的单一媒体传输路径拆解...

Read More
2026-05-05 talkingdev

AI上线即翻车?Notion、Ramp、Stripe都在用的Braintrust,24小时内校准模型性能

与传统软件不同,AI系统的问题往往并非代码逻辑错误,而是模型行为与预期之间的偏差。正因如此,仅仅依赖传统监控手段很难快速定位“为什么刚上线的改动就搞崩了生产环境”。Braintrust 正是为解决这一痛点而设计的AI...

Read More
2026-05-04 talkingdev

OpenAI 的“无代码”工程革命:用 AI Agent 编排软件开发新模式

OpenAI 近期在内部工程实践中推行了一种被称为“Harness Engineering”的软件开发理念,它并非字面意义上的不写代码,而是引导工程师将注意力从手写逻辑转向构建 AI Agent 能够自主运行的环境和“控具”(Harness)。核...

Read More
2026-05-04 talkingdev

AI Agent的“缰绳”应该放在沙箱外?Mendral团队给出安全新解

随着AI Agent在复杂任务中的广泛应用,其核心控制机制——Agent Harness的架构设计正成为影响安全性和多用户协作效率的关键因素。Agent Harness本质上是驱动大语言模型(LLM)的控制循环,负责与外部环境交互、管理凭...

Read More
2026-05-04 talkingdev

开源|AutoRound:10分钟单GPU搞定7B大模型量化,极致压缩精度不减

在大型语言模型(LLM)和视觉语言模型(VLM)部署中,模型量化是降低计算和存储成本的关键技术。然而,传统量化方法往往需要在模型大小和推理精度之间做出艰难取舍,尤其是在超低位宽(如2-bit、3-bit)下,精度损失...

Read More
2026-05-04 talkingdev

OpenAI为Codex新增动画宠物与配置导入功能:桌面编程助手更具亲和力

OpenAI近日为其编程助手Codex推出了一系列旨在提升用户体验与实用性的更新。最引人注目的变化是引入了“动画宠物”功能,这些虚拟宠物会以屏幕浮层的形式出现,并通过简短的气泡消息与用户进行互动。这一设计不仅赋予...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page