漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-06-03 talkingdev

开源| Wall Attention:新型注意力机制突破长文本推理瓶颈,channels维度引入乘性衰减

在处理长文本或长时间序列时,标准Transformer模型的内存占用和计算复杂度会随序列长度平方级增长,并面临信息稀释问题。GitHub上最新开源的“Wall Attention”项目提出了一种极具创新性的注意力变体机制:通过引入带...

Read More
2026-06-03 talkingdev

MiniMax发布M3模型:百万级上下文窗口与开源权重承诺来袭

中国AI创企MiniMax近日正式推出了其最新一代的M3大语言模型,并通过API和Token计划向开发者开放。该模型最引人注目的特点之一是拥有高达100万token的超长上下文窗口,并且官方承诺API至少保证提供51.2万个token的处...

Read More
2026-06-02 talkingdev

英伟达发布Cosmos 3:物理AI开源基础模型,融合视觉推理与多模态生成

英伟达今日正式发布Cosmos 3,这是一款面向物理AI的开源世界基础模型,标志着AI在理解与生成物理世界能力上的重大突破。Cosmos 3采用了创新的混合专家变换器(Mixture-of-Transformers)架构,将视觉推理、世界生成...

Read More
2026-06-02 talkingdev

重新定义搜索:Perplexity 提出“搜索即代码”,让AI模型直接操控搜索流程

Perplexity AI 在其最新研究论文中提出了一种名为“搜索即代码”(Search as Code,简称 SaC)的全新搜索架构范式。该方案通过提供一个软件开发工具包(SDK),赋予大语言模型对搜索流程的直接编程控制权。与传统将搜...

Read More
2026-06-02 talkingdev

视频智能体模型是下一波浪潮 — xAI Grok Imagine 负责人 Ethan He 深度解读

在生成式AI的激烈竞争中,视频生成与世界模型正成为下一个前沿战场。Ethan He,这位曾领导NVIDIA Cosmos世界模型项目的核心人物,在加入xAI后仅用三个月便主导构建了Grok Imagine图像生成系统。在一篇长达98分钟的深...

Read More
2026-06-02 talkingdev

Qwen3.7-Plus发布:统一视觉与语言的通用多模态智能体模型

阿里巴巴通义千问团队近日发布了其最新的多模态智能体模型Qwen3.7-Plus,标志着通用人工智能在感知与行动融合层面迈出了重要一步。该模型将视觉识别与语言理解能力深度融合,构建了一个单一、通用的多模态智能体基础...

Read More
2026-06-01 talkingdev

开源|odysseus:私人AI工作空间,自主代理自动化复杂任务

在云端AI服务日益普及的今天,数据隐私和自主可控成为了技术爱好者与专业团队关注的焦点。GitHub上名为“Odysseus”的开源项目应运而生,它定位为一款自托管的、注重隐私的AI工作空间。该项目由社区开发者pewdiepie-ar...

Read More
2026-06-01 talkingdev

开源|ECC:多智能体工作流性能优化系统,集成技能、记忆与安全扫描,助力AI开发工具链升级

在AI开发工具日益多元化的今天,如何让Claude Code、Codex、OpenCode、Cursor等不同智能体高效协同工作,成为一个关键的技术挑战。GitHub上开源的ECC项目提供了一套全面的解决方案,它被设计为一个“代理工具性能优化...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page