漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-03-13 talkingdev

逆向工程Claude生成式UI:在终端中重建交互式AI界面

近期,一项技术探索揭示了Anthropic公司旗下AI助手Claude的生成式用户界面(Generative UI)的内部工作机制,并将其成功移植到终端环境中。该技术本质上是一种特殊的工具调用,能够将HTML代码流式注入文档对象模型(...

Read More
2026-03-11 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴近日在GitHub上开源了名为“Page Agent”的项目,这是一个运行在网页内部的JavaScript图形用户界面(GUI)智能体。该技术的核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键...

Read More
2026-03-11 talkingdev

开源|RCLI:完全本地的macOS语音AI助手,无需云端即可控制电脑与文档问答

近日,GitHub上开源项目RCLI引发开发者社区关注。该项目是一款专为搭载Apple Silicon芯片的macOS设备设计的全本地化语音AI助手。其核心价值在于构建了一个完整的端侧AI处理流水线,集成了语音识别(Speech-to-Text)...

Read More
2026-03-11 talkingdev

开源|RCLI:本地化语音AI助手登陆macOS,无需云端即可控制应用与查询文档

近日,GitHub开源项目RCLI(RunanywhereAI/RCLI)发布,为macOS用户带来了一款完全在设备端运行的语音人工智能助手。该工具的核心创新在于其“全本地化”架构,集成了本地语音AI与检索增强生成(RAG)技术,用户可直接...

Read More
2026-03-11 talkingdev

谷歌发布Gemini Embedding 2:首个统一多模态嵌入模型,支持超百种语言

谷歌近日正式推出了其新一代多模态嵌入模型Gemini Embedding 2,标志着人工智能在跨模态语义理解领域迈出了关键一步。该模型通过Gemini API和Vertex AI平台提供服务,其核心突破在于首次将文本、图像、视频、音频及...

Read More
2026-03-10 talkingdev

开源|Mog语言:专为AI智能体设计的静态类型嵌入式编程语言

近日,一款名为Mog的新型编程语言在开发者社区引发关注。Mog被定位为一门静态类型、编译型、嵌入式语言,其设计理念与静态类型的Lua类似,但核心目标用户并非人类程序员,而是大型语言模型(LLM)。该语言的完整规范...

Read More
2026-03-09 talkingdev

开源|阿里开源Page Agent:用自然语言操控网页界面的JavaScript GUI智能体

阿里巴巴开源项目Page Agent近日在GitHub发布,这是一个运行于浏览器页面内的JavaScript图形用户界面智能体。其核心创新在于,允许用户直接使用自然语言指令(如“点击登录按钮”或“在搜索框输入关键词”)来操控网页界...

Read More
2026-03-09 talkingdev

开源|Karpathy发布AutoResearch项目:单GPU驱动的AI自主研究循环

知名AI研究员、前特斯拉AI总监Andrej Karpathy近日在GitHub上开源了AutoResearch项目,该项目旨在构建一个能够在单GPU小型LLM训练环境中运行的AI驱动自主研究循环系统。该系统允许AI智能体自动修改代码和指导文件,...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page