漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-01 talkingdev

TriplaneTurbo实现文本到3D模型的突破性进展

研究人员通过渐进式渲染蒸馏技术(Progressive Rendering Distillation),成功开发出无需真实3D网格数据即可从文本提示生成高质量3D模型的新方法。这一名为TriplaneTurbo的创新系统仅需1.2秒即可完成生成,在速度和...

Read More
2025-03-26 talkingdev

[论文推荐] FFaceNeRF:突破NeRF方法中的固定蒙版限制,实现更高效的3D人脸编辑

FFaceNeRF是一种基于NeRF(神经辐射场)的3D人脸编辑技术,通过克服传统NeRF方法中固定蒙版的限制,显著提升了3D人脸编辑的灵活性和精度。NeRF作为近年来计算机视觉领域的热门技术,能够在3D场景重建中生成高质量的...

Read More
2025-03-25 talkingdev

[论文推荐]TRG-Net:基于文本关系图的骨架动作分割技术

近日,一项名为TRG-Net的创新技术在动作分割领域取得了突破性进展。该技术通过利用文本衍生的关系图(Text-Derived Relational Graphs)来增强动作分割的精度,特别是在空间-时间建模和监督方面表现出色。动作分割是...

Read More
2025-03-25 talkingdev

Roblox开源Cube 3D AI模型,文本生成3D对象助力创作效率提升

Roblox近日开源了其最新的AI模型Cube 3D,该模型能够通过文本提示生成3D对象,旨在提升创作效率。Cube 3D采用了先进的标记化技术,并通过授权和公开可用的数据集,以及Roblox自身的体验数据进行训练。未来,Cube 3D...

Read More
2025-03-24 talkingdev

[开源]LHM模型:单张图像秒速生成可动画的3D人体模型

近日,GitHub上发布了一个名为LHM(Large Animatable Human Reconstruction Model)的开源项目,该项目展示了如何通过单张图像快速生成一个完全可动画的3D人体模型。这一技术突破不仅展示了计算机视觉领域的重大进展...

Read More
2025-03-24 talkingdev

SynCity:无需训练,从文本生成精细3D世界的创新系统

SynCity是一种革命性的系统,能够直接从文本提示生成详细的3D世界,而无需任何训练。该系统结合了2D图像生成器和3D生成器的优势,前者确保了艺术质量,后者则提供了精确的几何结构。SynCity以分块的方式构建场景,并...

Read More
2025-03-20 talkingdev

Stability发布沉浸式3D视频生成技术:Stable Virtual Camera

近日,Stability推出了一项名为Stable Virtual Camera的创新技术,该技术基于一种多视角扩散模型,能够从单张或多张2D图像中生成沉浸式3D视频。这一技术允许用户自定义或预设相机轨迹,从而实现对3D场景的灵活控制。...

Read More
2025-03-19 talkingdev

[开源] Stability AI发布多视角虚拟相机系统,支持新颖视图合成

Stability AI近日发布了一款强大的多视角虚拟相机系统,该系统能够实现新颖视图合成(Novel View Synthesis),为用户提供了一种高效且非商业化的解决方案。虽然该技术尚未达到行业最先进水平,但其优势在于仅需两次...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page