漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-04-21 talkingdev

通义千问Qwen3.6-Max-Preview发布:世界知识更强,代码能力大幅进化

阿里云旗下通义千问团队近日发布了其大型语言模型的最新预览版本——Qwen3.6-Max-Preview。该版本在多个核心能力上实现了显著提升,尤其是在世界知识的掌握与指令遵循的准确性方面表现突出。更为关键的是,模型在广泛...

Read More
2026-04-17 talkingdev

AI智能体Morphex深度进化:一年内自动提交数千PR,重构monday.com生产级单体架构

协作平台monday.com的工程团队近日披露了一项前沿技术实践:他们基于Anthropic的Claude Code SDK构建了一个名为Morphex的AI智能体,并将其直接部署在真实的生产代码库中进行了长达一年的“成长”实验。该智能体的核心...

Read More
2026-03-30 talkingdev

AI代理工作流新突破:揭秘Pretext算法背后的“约束-测量-隔离”循环

近期,一项名为Pretext的文本测量算法因其独特开发模式引发技术社区关注。该算法由AI代理工作流驱动构建,其核心创新在于能够在不依赖传统DOM测量与重排的前提下,快速、精准地完成网页布局计算。开发团队采用了一套...

Read More
2026-02-11 talkingdev

开源|AIRS-Bench:Meta发布首个端到端AI研究能力基准,量化大模型代理的科研潜力

Meta(原Facebook)旗下研究团队近日在GitHub开源了AIRS-Bench基准测试框架,旨在系统性地量化大型语言模型(LLM)代理在真实世界人工智能研究任务中的端到端能力。该基准包含20个精心设计的机器学习研究任务,每个...

Read More
2026-01-19 talkingdev

Cursor揭秘Bugbot进化之路:从定性评估到AI驱动指标,如何系统性提升代码审查智能体效能

Cursor公司近日详细披露了其AI驱动的代码审查智能体Bugbot的系统性优化历程。Bugbot专为在代码拉取请求中识别逻辑错误、性能问题和安全漏洞而设计,其发展路径标志着AI辅助开发工具从依赖定性反馈到建立量化评估体系...

Read More
2026-01-11 talkingdev

开源|Open Chaos:一个自我演化的开源项目

近日,一个名为Open Chaos的开源项目在技术社区引发了广泛关注。该项目定位为一个“自我演化”的开源项目,其核心理念在于构建一个能够根据社区贡献、用户反馈和环境变化而自主适应、持续进化的软件系统。这标志着开源...

Read More
2025-12-09 talkingdev

论文推荐|无需人工标注!新型自训练框架让视觉语言模型学会自我评判

一项突破性的研究提出了一种无需任何人工偏好标注即可训练视觉语言模型评判者的全新框架。该框架的核心在于通过自我合成数据实现迭代式自训练,从而摆脱了对昂贵且易过时的人工标注的依赖。其工作流程分为三个阶段:...

Read More
2025-12-07 talkingdev

AI浪潮下的“二次创业”:Airtable、Handshake等多家公司宣布“重构”以拥抱人工智能

据《纽约时报》记者Lora Kelley报道,在人工智能技术迅猛发展的时代背景下,近期涌现出一股引人注目的企业战略转型浪潮。包括Airtable、Handshake和Opendoor在内的多家知名科技公司,相继公开宣布正在进行“重构”或“...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page