漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-11 talkingdev

文本到3D模型的评估指标

研究人员开发了一种新的文本到3D生成模型的评估指标,解决了当前单一标准指标的局限性。这种先进的方法使用GPT-4V来创建提示并比较3D资产。它与人类偏好密切相关,并通过适应各种用户定义的标准来提供多样性。

Read More
2024-01-10 talkingdev

论文:研究人员开发出4D人脸视频编辑技术

研究人员开发出一种人脸视频编辑架构,该架构结合了GAN-NeRF技术用于3D一致性和一种新的稳定器用于平滑的时间相干性。这种方法在编辑视频方面表现出色,通过保持一致的视角和帧之间的无缝转换来实现。

Read More
2024-01-08 talkingdev

论文:掌握3D场景,增强视觉问答技术

随着视觉问答技术的不断发展,大多数模型只涉及2D推理,忽略了3D视觉场景的复杂性。这项研究提出了3D感知的视觉问答技术。通过对3D场景的理解和分析,模型可以更精准地回答问题,具有更高的准确率和可解释性。该技术...

Read More
2023-12-25 talkingdev

单张图像快速重建3D模型技术突破:高斯飞溅技术推动3D重建前进

近日,一项关于单张图像快速重建3D模型的新技术取得了突破。该技术基于高斯飞溅技术,通过学习性技术将图像中的每个像素映射到一个3D高斯函数中,从而实现单张图像的3D重建。这一技术的创新点在于引入了“飞溅图像”,...

Read More
2023-12-22 talkingdev

论文:使用2D标记点进行3D结构重建的新模型问世

新的3D-LFM模型采用变压器从2D标记点重建3D结构,无需“对应”3D数据。这种方法是首个这样处理不同点数量、遮挡并且具有泛化能力的方法。

Read More
2023-12-22 talkingdev

Zoo Dev推出文本转CAD功能

Zoo Dev(前身为Kitty Cad)进行了重新品牌推广并发布了一项新的文本转CAD功能。这是一个功能强大的平台,可以生成可用于打印或零件的3D资产。

Read More
2023-12-21 talkingdev

M3DBench-全面的3D指令跟踪数据集发布

M3DBench是一个全新的广泛数据集,旨在改变AI的3D理解,填补多模态语言模型研究中的差距。它包括超过320,000个不同的指令响应对,集成了文本、图像和3D对象,为AI执行更广泛的现实3D任务铺平了道路。

Read More
2023-12-18 talkingdev

论文:LLMs如何提高3D场景理解能力

一种新的研究方法通过在大型语言模型中引入物体标识符来改善对3D场景的理解并回答相关问题。该方法专注于识别和关联场景中的物体,在解释复杂的空间关系方面取得了有希望的结果,使得人工智能更加擅长这方面的任务。

Read More
  1. Prev Page
  2. 14
  3. 15
  4. 16
  5. Next Page