漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-29 talkingdev

论文:3D医学图像分割技术SegMamba

SegMamba是一种专为3D医学图像分割设计的模型,它提供了一种比Transformer架构更高效的替代方案。SegMamba采用全卷积神经网络架构,可以对3D医学图像进行有效的分割,尤其是在肿瘤分割方面表现出色。与传统的医学影...

Read More
2024-01-29 talkingdev

RoMa-PyTorch中的旋转操作库开源

RoMa是一个用于PyTorch的库,用于处理棘手的旋转问题。它非常高效,可以帮助处理任何使用3D数据的项目。

Read More
2024-01-26 talkingdev

论文:HEDNet提升自动驾驶的3D物体检测能力

HEDNet是一种新的编码器-解码器网络,旨在增强自动驾驶中的3D物体检测能力,特别是针对3D场景中稀疏点分布的挑战。该网络采用多分支设计,结合了高效的感受野对齐和多尺度信息融合技术,能够快速而准确地检测出道路...

Read More
2024-01-26 talkingdev

MIT研究团队展示了一种快速打印金属的新方法

麻省理工学院的一个团队宣布了一种新的金属3D打印方法,该方法将打印速度和规模优先于分辨率。它能够以至少比可比金属添加制造过程快10倍的速度打印大型铝制品。该技术利用了一层100微米玻璃珠来创建一个结构,然后...

Read More
2024-01-24 talkingdev

GroupAnything:解决3D语义分组难题

3D中进行分组是一个具有挑战性和模糊性的任务,因为您不知道需要多细粒度的分组操作(例如,键盘上的键与整个键盘本身)。这项工作使用多级蒙版,在解决语义3D分组问题方面取得了重大进展。

Read More
2024-01-23 talkingdev

HuggingFace发布针对3D并行的代码库Nanotron

近日,HuggingFace发布了一个名为Nanotron的小型而强大的库,用于训练具有3D并行性的模型。这意味着它将数据、模型和模型中的层/张量分割开来。前两种并行性在PyTorch等库中得到了很好的支持。然而,将模型张量分割...

Read More
2024-01-21 talkingdev

论文:自动驾驶汽车视觉基础模型前沿技术分析

本文探讨了开发自动驾驶汽车视觉基础模型(VFMs)所面临的挑战。通过分析超过250篇研究论文,它提供了有关数据准备,预训练和AI任务适应的见解,重点介绍了NeRF和3D高斯点渲染等前沿技术。

Read More
2024-01-20 talkingdev

CaC开源-将3D物体放置在图像生成中

Compose and Conquer公司推出了一种条件扩散模型,该模型在生成的图像中的三维空间中放置物体方面表现出色。该模型可用于生成逼真的图像,例如虚拟世界中的景观和人物。条件扩散模型的优点在于其可以对图像进行分层...

Read More
  1. Prev Page
  2. 13
  3. 14
  4. 15
  5. Next Page