漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-08 talkingdev

DP3引领机器人模仿学习新方向

DP3推出了一种先进的模仿学习方法,结合3D视觉数据和扩散策略,以高效的方式为机器人教授复杂技能。该方法通过将多个示教者的动作数据进行聚合,形成一个复杂的运动模型,并通过扩散过程来优化该模型。该模型可以有...

Read More
2024-03-05 talkingdev

dust3r-轻松实现 3D 几何视觉

这个项目支持从一组松散相关的图像中构建 GLB 格式的 3D 表示,这意味着您可以拍摄一个地点的几张照片,为 3D 使用重构它。

Read More
2024-03-04 talkingdev

PL2Map-轻量级神经网络实现3D建图

该项目介绍了一种新的3D建图和定位方法,使用轻量级神经网络处理点和线特征,显著提高了姿态准确性,同时占用更少的内存和计算要求。为了实现更快的姿态估计和更准确的3D建图,该方法使用了一种新的神经网络结构,该...

Read More
2024-02-29 talkingdev

自动驾驶中的3D物体检测框架开源

EMIFF是一种创新的基于摄像头的3D检测框架,用于车辆基础设施协同物体检测。它使用多尺度交叉注意力和相机感知通道掩蔽来纠正来自相机异步性的姿态误差。EMIFF的开源代码现在可以在GitHub上获得。

Read More
2024-02-28 talkingdev

多场景3D重建技术框架开源

该项目介绍了一个多视角3D重建框架,不需要先验场景深度知识。它智能地选择最相关的源帧,使其适用于包括大规模室外和俯视建筑环境在内的各种场景。这项技术的突破将极大地提高3D重建的效率和精度,可应用于数字娱乐...

Read More
2024-02-28 talkingdev

FlowMDM实现长时间人体动作生成

FlowMDM是一种新的模型,用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建,无需额外的去噪步骤,在关键数据集上表现出卓越的准确性和逼真度。

Read More
2024-02-23 talkingdev

多视角扩散+:生成引人入胜的3D视图

最近,一种名为多视角扩散++的扩散模型引起了人们的注意。该模型可以生成一个对象的多个视图,然后将它们拼接在一起,形成一个引人入胜的3D版本。这个模型的基本原理是将对象分解成许多微小的部分,然后在每个部分上...

Read More
2024-02-22 talkingdev

GausO-用4张照片生成高质量3D物体

该仓库提供了一种方法,可以利用四张照片生成高质量的3D物体,采用的是高斯平面填充技术。该技术可以将照片中的物体转化为点云,再通过高斯平面填充算法生成3D物体。这种方法不需要大量的照片和设备,可以在普通相机...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page