漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-19 talkingdev

阿里Qwen3.7预览版登陆Arena,文本与视觉双赛道排名飙升

阿里巴巴通义千问团队近日在Arena平台上发布了Qwen3.7预览版,涵盖文本和视觉两大核心能力。据悉,Qwen3.7 Max Preview在文本竞技场中位列第13名,而Qwen3.7 Plus Preview则在视觉竞技场中排名第16,显示出阿里在大...

Read More
2026-05-08 talkingdev

OpenAI再掀语音革命:发布GPT-Realtime多模态实时音频模型,开启对话式AI新纪元

OpenAI近日在API中正式推出了一系列全新的实时音频模型,标志着语音交互技术迈入了一个全新阶段。该系列包括三款核心模型:GPT-Realtime-2,专注于增强对话式推理能力,能够实现更自然、更具逻辑性的实时语音对话;G...

Read More
2026-04-20 talkingdev

OpenClaw的双面叙事:公众愿景与工程挑战并存,Anthropic携Claude Design进军设计领域

本周,Peter Steinberger的演讲揭示了OpenClaw项目呈现出的两种截然不同的叙事:一方面是鼓舞人心的公众愿景,另一方面则是工程师视角下对安全性与可扩展性挑战的严肃审视。与此同时,人工智能公司Anthropic正式推出...

Read More
2026-03-31 talkingdev

开源|谷歌发布TimesFM时间序列基础模型,革新时序预测范式

谷歌研究团队近日在GitHub上开源了TimesFM(Time Series Foundation Model),这是一个预训练的时间序列基础模型,专为时间序列预测任务而设计。该模型采用了一种创新的“分块解码器”风格注意力架构,并在一个大规模...

Read More
2026-03-17 talkingdev

NVIDIA GTC 2026前瞻:全面扩展AI技术栈,覆盖模型、智能体与机器人

在GTC 2026技术大会的预告中,NVIDIA勾勒了一幅宏大的AI技术发展蓝图,宣布将全面扩展其人工智能技术栈。该计划的核心在于构建一个跨越多个关键领域的综合性AI生态系统。具体而言,NVIDIA将深化与各方的合作,共同推...

Read More
2026-01-23 talkingdev

开源|通义千问Qwen3-TTS系列全面开源:支持语音克隆、音色设计与多语言生成

阿里云旗下通义千问团队正式宣布,其Qwen3-TTS系列语音生成模型现已全面开源。该系列模型代表了当前语音合成领域的前沿技术水平,集成了语音克隆、音色设计、超高拟人度语音生成以及基于自然语言的语音控制等核心功...

Read More
2025-12-24 talkingdev

开源|MicroQuickJS:面向嵌入式系统的超轻量级JavaScript引擎

近日,由知名开发者Fabrice Bellard推出的MicroQuickJS项目在GitHub上引发关注。这是一个专为资源极度受限的嵌入式系统设计的JavaScript引擎,其核心突破在于能够在仅10KB的RAM环境下编译并运行JavaScript程序。Micr...

Read More
2025-12-12 talkingdev

OpenAI发布GPT-5.2:专为专业工作与长期智能体设计的顶尖前沿模型

人工智能研究机构OpenAI正式发布了其最新的前沿模型GPT-5.2,该模型被定位为专为专业知识工作和长期运行的智能体(agents)而设计的最先进系统。根据官方介绍,GPT-5.2在多个关键领域树立了新的性能标杆,包括代码生...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page