漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-21 talkingdev

谷歌发布Agent Executor:分布式AI代理运行的开源新标准

谷歌云近日正式推出Agent Executor,这是一个面向AI代理(Agent)的分布式运行时开源标准,旨在解决长时间运行的代理工作流在可靠性、效率和扩展性上的核心挑战。Agent Executor通过引入持久化执行机制,确保代理任...

Read More
2026-05-14 talkingdev

开源|Cline 发布开源 Agent 运行时 SDK,重塑编码 Agent 开发范式

在 AI Agent 开发工具链持续演进的浪潮中,Cline 团队正式推出了面向编码 Agent 的开源运行时 SDK —— @cline/sdk。这一框架旨在为构建复杂的、具备自主动作能力的 Agent 应用提供标准化的底层支持。其核心特色在于...

Read More
2026-05-14 talkingdev

七位顶尖研究者加盟,4亿美元估值打造“自我进化”AI

一家名为Recursive Superintelligence的初创公司近日宣布,已成功融资超过6.5亿美元,公司估值突破40亿美元。该公司致力于研发能够实现自我改进的人工智能系统,旨在大幅减少甚至完全摆脱对人类开发者的依赖。其七位...

Read More
2026-05-12 talkingdev

开源|AutoTTS:无需梯度更新,用编码Agent自动探索测试时扩展策略

在AI大模型推理成本与日俱增的背景下,测试时扩展(Test-Time Scaling)正成为提升模型性能的前沿方向之一。近日,来自开源社区的项目AutoTTS提出了一种全新的自动化策略发现框架,旨在通过编码Agent在回放环境中迭...

Read More
2026-05-11 talkingdev

OpenAI发布实时语音翻译构建指南,专为同声传译优化的GPT模型登场

OpenAI近日发布了一份工程指南,详细介绍了如何使用其最新优化的模型gpt-realtime-translate构建实时语音翻译系统。该模型专为同声传译场景设计,与传统的轮次语音交互不同,它能实现对语音流进行实时、连续的翻译处...

Read More
2026-05-08 talkingdev

OpenAI再掀语音革命:发布GPT-Realtime多模态实时音频模型,开启对话式AI新纪元

OpenAI近日在API中正式推出了一系列全新的实时音频模型,标志着语音交互技术迈入了一个全新阶段。该系列包括三款核心模型:GPT-Realtime-2,专注于增强对话式推理能力,能够实现更自然、更具逻辑性的实时语音对话;G...

Read More
2026-05-03 talkingdev

美国马里兰州率先立法:禁止超市用AI驱动“监控定价”涨价

马里兰州成为美国首个立法禁止超市利用AI技术实施“监控定价”(Surveillance Pricing)的州。该法案针对零售商利用摄像头、人脸识别、购物历史数据等AI系统,实时分析消费者行为并动态调整商品价格的做法。这种技术不...

Read More
2026-03-31 talkingdev

开源|谷歌发布TimesFM时间序列基础模型,革新时序预测范式

谷歌研究团队近日在GitHub上开源了TimesFM(Time Series Foundation Model),这是一个预训练的时间序列基础模型,专为时间序列预测任务而设计。该模型采用了一种创新的“分块解码器”风格注意力架构,并在一个大规模...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page