Thinking Machines Lab 近日发布了一项名为“交互模型”的研究预览,旨在通过音频、视频和文本三种模态,实现人类与人工智能之间的实时协作。该模型采用从头训练的“多流架构”,能够持续处理与交换多模态信息,彻底打破...
Read MoreOpenAI近日详细披露了其用于全球规模实时语音交互的低延迟基础设施架构。该架构基于重新设计的WebRTC协议,核心采用了分体中继(split relay)和收发器(transceiver)模型。通过将传统WebRTC的单一媒体传输路径拆解...
Read MoreOmnara推出了一款创新的移动与网页客户端,旨在彻底改变开发者与AI编程助手(如Claude Code和Codex)的交互方式。该平台允许用户通过手机或任何网页浏览器,远程控制运行在个人电脑上的AI编程会话,实现了真正的跨设...
Read More近日,开发者Jason-uxui在GitHub平台开源了名为“project-dashboard”的项目仪表盘工具,旨在为开发团队及项目管理提供高效的可视化协作解决方案。该工具允许用户通过创建GitHub账户参与贡献,其核心价值在于将复杂的...
Read Moretldraw正式推出SDK 4.0版本,这是一个专为构建无限画布应用设计的TypeScript库。新版SDK引入了革命性的CLI工具`npm create tldraw`,提供包括智能代理、工作流管理和多人实时协作在内的多种入门套件。该工具集成了先...
Read More谷歌视频会议平台Google Meet近日宣布推出实时语音翻译功能,该功能基于DeepMind开发的先进音频语言模型,能够在翻译过程中保留说话者的声音、语调和表达方式。这一技术的突破性在于它不仅实现了语言的即时转换,还...
Read More近日,一款名为screenrecorder.me的网页版屏幕录制工具在技术社区引发关注,该项目定位为Screen Studio的免费替代方案,主打轻量化、免安装特性。开发者通过WebRTC等浏览器原生技术实现高清录屏功能,支持跨平台使用...
Read MoreVoxon公司近日发布了一项突破性的技术——实时互动全息影像。这项技术让用户能够与三维空间中的图像进行实时交互,而无需佩戴任何头戴设备。Voxon的全息系统能够将数字内容转换成真实的三维图像,从而在医疗、教育、设...
Read More