漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-06 talkingdev

SAM.cpp:Meta全新纯C++运行部分的分割技术

Meta公司最新研发的SAM.cpp项目现已在GitHub仓库中开源。这是一项运行于纯C++环境下的分割技术,其底层驱动是GGML。SAM.cpp能够实现Meta上的任何内容的精细分割,不论是图像、视频,还是复杂的3D模型,都能够轻松应...

Read More
2023-09-01 talkingdev

论文:用文本调制技术提升图像生成质量

仅从少数样本中产生多样化的图像一直是技术上的挑战。而新的技术——TexMod,采用独特的技术方法,将各种图像的细节融合在一起,并确保生成的图像具有逻辑性的布局。TexMod的出现,不仅提升了图像生成的质量,也为图像...

Read More
2023-09-01 talkingdev

评估计算机视觉模型的公平性:Meta发布DINO v2模型

在持续推动成为AI领域的开源贡献者的过程中,Meta公司近日公布了他们的DINO v2模型,并采用了更为宽松的许可证,允许社区在其基础上进行构建。此外,他们还发布了一个数据集,有助于确定并对各种计算机视觉模型中的...

Read More
2023-08-25 talkingdev

论文:LiDAR点追踪3D物体的新方法

大多数计算机视觉工具在使用LiDAR点追踪3D物体时,由于干扰或未注意到长期运动,常常遇到困难。为了解决这些问题,MTM-Tracker混合使用了两种方法,并分为两个阶段进行工作。在第一阶段,MTM-Tracker使用基于模型的...

Read More
2023-08-24 talkingdev

TOPIC开源,多目标跟踪新突破并发布复杂动作数据集BEE23

近日,一群研究者开发出一套名为TOPIC的新系统,能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动,而且还可以有效处理对象的外观变化,显著提高了多目标跟踪的准确性和效率。为...

Read More
2023-08-24 talkingdev

Roboflow-最新开源的视觉模型推理工具

Roboflow推理是一种在最先进的计算机视觉模型上运行推理的工具。它可以在各种设备和环境上部署,无需机器学习的先验知识。Roboflow推理支持目标检测、分类、实例分割模型以及基础模型。有一个展示Roboflow推理在足球...

Read More
2023-08-23 talkingdev

优化3D场景理解:DReg-NeRF的新技术将改变现状

神经辐射场(NeRF)在计算机视觉领域已经成为热门话题,然而如何有效地将多个NeRF结合在一起仍然是一个挑战。为了解决这个问题,研究团队开发出了一种名为DReg-NeRF的新方法。DReg-NeRF能有效提取NeRF中的特征,使用...

Read More
2023-08-22 talkingdev

RLIPv2:一个更优秀的语言视觉模型

RLIPv1是一种帮助计算机将图像与描述性词语相连接的方法,但是它存在一些问题,尤其是运行缓慢和数据缺乏。这篇新的论文介绍了RLIPv2,这是一个更快速的版本,它使用了一种新的工具ALIF来更好地融合图像和词语。同时...

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page