漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-29 talkingdev

[开源] Beatsync:跨设备毫秒级精准同步的网页音频播放器

开发者freeman-jiang近日推出开源项目Beatsync,这是一款基于浏览器的网页音频播放器,能够实现多设备间毫秒级精度的音频同步播放,无需额外硬件即可将任意设备组转变为环绕声系统。该项目采用类似网络时间协议(NTP...

Read More
2025-04-29 talkingdev

Valeo AI推出VaViM和VaVAM:生成式视频模型革新自动驾驶轨迹预测

Valeo AI最新发布了两项突破性技术:VaViM自回归视频模型和VaVAM驾驶轨迹预测模型。VaViM通过时空令牌序列预测技术,实现了对连续视频帧的高精度建模;而VaVAM则创新性地将学习到的视频表征通过模仿学习转化为可执行...

Read More
2025-04-28 talkingdev

Pippo开源:单张图生成高分辨率多视角3D模型

Meta研究院推出的Pippo项目突破传统三维重建技术限制,开发了一套无需预训练模型的虚拟人体生成系统。该系统仅需输入单张二维人像,即可输出具有高保真细节的多视角3D人体表征,其核心技术可能涉及神经辐射场(NeRF...

Read More
2025-04-26 talkingdev

[开源] 开发者成功在复古IBM ThinkPad上运行自研32位操作系统RetrOS-32

开发者Joe Bayer近日宣布其个人项目RetrOS-32操作系统成功在IBM经典ThinkPad设备上完成实机部署。这款针对i386架构开发的操作系统具备图形界面、多任务处理、网络功能等现代特性,并创新性地集成了32位C语言编译器。...

Read More
2025-04-26 talkingdev

MILS开源-无需训练即可实现视觉与听觉感知

Facebook研究团队近日在GitHub开源了MILS项目代码,其核心突破在于证明大型语言模型(LLMs)无需额外训练即可具备跨模态感知能力。该项目论文《LLMs can see and hear without any training》提出创新方法,通过重构...

Read More
2025-04-26 talkingdev

[开源] Stuffed-Na(a)N:为NaN填充数据的创新JavaScript库

近日,GitHub上出现了一个名为Stuffed-Na(a)N的开源项目,该项目旨在解决JavaScript中NaN(Not a Number)值的处理问题。NaN在数值计算中经常出现,但传统的处理方法往往不够灵活。Stuffed-Na(a)N通过提供一种创新的...

Read More
2025-04-25 talkingdev

[开源] Magnitude:基于视觉大模型的Web应用测试框架,开源发布

开发者Anders和Tom近日在Hacker News上宣布推出Magnitude,一个完全开源的、基于视觉大模型(VLM)的端到端Web应用测试框架。该框架旨在解决传统浏览器代理测试工具速度慢、成本高且结果不一致的问题。Magnitude采用...

Read More
2025-04-25 talkingdev

[开源] 使用Lean定理证明器重写《数学原理》:罗素经典著作的现代化尝试

近日,开发者ndrwnaguib在GitHub上发布了一个引人注目的开源项目,旨在使用Lean4定理证明器对伯特兰·罗素教授的经典著作《数学原理》第一卷进行形式化验证。该项目严格遵循罗素原著中的证明过程,仅在必要时添加形式...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page