漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-20 talkingdev

开源项目:针对新物体的实例分割模型

近日,一款名为Instance Segmentation for Novel Objects的GitHub开源项目备受关注。该项目旨在评估深度学习模型在实例分割方面对新物体的泛化能力。通过该项目,用户可以训练自己的实例分割模型,并对模型进行评估...

Read More
2023-12-08 talkingdev

Meta开源高效分割技术SAM

Segment Anything是一款出色的模型,但运行速度较慢。Efficient Segment Anything是一款新模型,使用多种优化技术,运行速度显著提高。

Read More
2023-11-10 talkingdev

Roboflow发布GPTV示例,辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。

Read More
2023-11-02 talkingdev

HF开源结合语言模型和计算机视觉进行开放式分词

Hugging Face Space最近发布了两项重要技术:Segment Anything和MetaCLIP,这两项技术结合了最强大的语言模型和计算机视觉技术,能够基于文本输入进行开放式分词。开放式分词是计算机视觉领域中一个新颖且令人兴奋的...

Read More
2023-11-01 talkingdev

MPVSS,视频语义分割的掩码传播技术

最新研究引入了一种名为MPVSS的视频内容分割方法,这种方法通过关注关键帧,然后基于这些关键帧预测其他帧的掩码,从而减少计算负载。在这种方法中,首先选定一些关键帧,然后在这些帧上进行语义分割。接下来,通过...

Read More
2023-10-25 talkingdev

使用SAM模型进行3D医学影像分割

SAM-Med3D是Segment Anything Model(SAM)的升级版,专门针对3D医学影像进行了优化。虽然原始的SAM在处理3D医学影像时存在困难,但是经过对超过131K个3D掩模的广泛数据集进行训练的SAM-Med3D在捕捉3D空间细节方面使...

Read More
2023-10-23 talkingdev

SoM开源,多模态语言模型的新进展

多模态语言模型(multimodal language models)的发展正日益成熟。最近,一种名为State of Mark prompting的方法在GitHub Repo上引起了广泛关注。该方法首先使用Segment Anything算法对图像进行处理,对检测到的类别...

Read More
2023-09-14 talkingdev

UMMAFormer:有效识别视频中的伪造内容

随着人工智能制造的假内容的增多,我们急需一种能够精确识别被修改视频部分的方法,而新工具“UMMAFormer”就能更有效地识别这些视频中的假内容。相比以往的方法,“UMMAFormer”在识别视频伪造部分上表现出了更高的效率...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page