漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-22 talkingdev

HybridNeRF:高效的神经渲染技术

近日,研究人员提出了一种名为HybridNeRF的神经渲染技术,其可以在保持渲染质量的同时大幅缩短渲染时间。该技术利用了机器学习算法和传统渲染技术的优势,使得渲染速度可以提高数倍。研究人员表示,HybridNeRF可以被...

Read More
2024-05-21 talkingdev

PSG-4D全景场景图生成,让AI理解时空世界的技术开源

PSG-4D是一种全新的表示法,帮助AI理解空间和时间的四维世界。这种技术的GitHub Repo已经开源。该技术能够生成4D全景场景图,通过这种场景图,AI不仅能够理解物体的三维空间位置,还能理解物体随时间的变化。这是一...

Read More
2024-01-29 talkingdev

论文:基于Transformer的场景图生成技术问世

研究人员开发出了一种新方法来创建场景图,使该过程更快速和高效。他们基于Transformer的技术专注于改进模型对图像中不同元素的理解和连接方式,从而提高了模型在挑战性任务上的性能。

Read More
2024-01-20 talkingdev

CaC开源-将3D物体放置在图像生成中

Compose and Conquer公司推出了一种条件扩散模型,该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像,例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

Read More
2023-12-05 talkingdev

OpenAI的联合创始人Sam Altman被解雇和重新雇用:采访回顾

OpenAI的前任首席执行官兼联合创始人Sam Altman在公司的董事会更迭后重返公司。在最近的一次采访中,Altman没有讨论他被解雇的原因,但分享了他的反抗感和最终接受重返公司的感受。OpenAI的最大投资者微软也计划获得...

Read More
2023-10-24 talkingdev

全新激光雷达全景分割方案发布

该项目提出了一种新的基于检测的网络用于激光雷达全景分割(LPS)和跟踪,摆脱了传统的以分割为重点的方法。该方案通过检测和分割相结合的方式,实现了对复杂场景中车辆、行人等目标的精准定位和跟踪,极大提高了激...

Read More
2023-10-18 talkingdev

LLMs在场景图生成中的改进技术应用开源

本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

Read More