漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2026-05-12 talkingdev

Thinking Machines Lab发布交互模型:实时人机协作的可扩展新范式

Thinking Machines Lab 近日发布了一项名为“交互模型”的研究预览,旨在通过音频、视频和文本三种模态,实现人类与人工智能之间的实时协作。该模型采用从头训练的“多流架构”,能够持续处理与交换多模态信息,彻底打破...

Read More
2026-05-05 talkingdev

OpenAI披露低延迟语音AI全球架构:WebRTC分体中继与收发器模型成关键

OpenAI近日详细披露了其用于全球规模实时语音交互的低延迟基础设施架构。该架构基于重新设计的WebRTC协议,核心采用了分体中继(split relay)和收发器(transceiver)模型。通过将传统WebRTC的单一媒体传输路径拆解...

Read More
2026-02-13 talkingdev

Omnara:用手机或网页远程操控AI编程助手,实现跨设备无缝开发

Omnara推出了一款创新的移动与网页客户端,旨在彻底改变开发者与AI编程助手(如Claude Code和Codex)的交互方式。该平台允许用户通过手机或任何网页浏览器,远程控制运行在个人电脑上的AI编程会话,实现了真正的跨设...

Read More
2026-01-03 talkingdev

开源| 开发者Jason-uxui发布项目仪表盘工具,助力团队可视化协作与进度管理

近日,开发者Jason-uxui在GitHub平台开源了名为“project-dashboard”的项目仪表盘工具,旨在为开发团队及项目管理提供高效的可视化协作解决方案。该工具允许用户通过创建GitHub账户参与贡献,其核心价值在于将复杂的...

Read More
2025-09-19 talkingdev

tldraw发布SDK 4.0:用React构建实时协作白板应用

tldraw正式推出SDK 4.0版本,这是一个专为构建无限画布应用设计的TypeScript库。新版SDK引入了革命性的CLI工具`npm create tldraw`,提供包括智能代理、工作流管理和多人实时协作在内的多种入门套件。该工具集成了先...

Read More
2025-05-21 talkingdev

Google Meet推出实时语音翻译功能,DeepMind音频语言模型助力跨语言交流

谷歌视频会议平台Google Meet近日宣布推出实时语音翻译功能,该功能基于DeepMind开发的先进音频语言模型,能够在翻译过程中保留说话者的声音、语调和表达方式。这一技术的突破性在于它不仅实现了语言的即时转换,还...

Read More
2025-04-28 talkingdev

ScreenStudio录屏工具免费替代版

近日,一款名为screenrecorder.me的网页版屏幕录制工具在技术社区引发关注,该项目定位为Screen Studio的免费替代方案,主打轻量化、免安装特性。开发者通过WebRTC等浏览器原生技术实现高清录屏功能,支持跨平台使用...

Read More
2024-12-18 talkingdev

Voxon技术实现实时互动全息影像

Voxon公司近日发布了一项突破性的技术——实时互动全息影像。这项技术让用户能够与三维空间中的图像进行实时交互,而无需佩戴任何头戴设备。Voxon的全息系统能够将数字内容转换成真实的三维图像,从而在医疗、教育、设...

Read More
  1. Next Page