漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-05 talkingdev

基于代码的计算机视觉研究平台(GitHub代码库)

Scenic是一个以注意力为核心的计算机视觉研究代码库。

Read More
2023-06-26 talkingdev

AI生成图像的单一图像编辑方案:解开图像编辑的离散化之道

学习离散化表示是计算机视觉领域的一个令人兴奋的研究领域。像CLIP这样的大规模对比方法一度让离散化研究失去了市场。然而,现在,借助开源扩散模型,我们可以利用文本标记的力量来解开图像中的对象,实现对AI生成图...

Read More
2023-06-26 talkingdev

TIMM计算机视觉工具套件

TIMM中有许多顶级计算机视觉模型,但在处理生产系统时,通常需要更多。OpenMMlab提供了一套高质量的系统,用于各种视觉任务,如姿态和分割。

Read More
2023-06-15 talkingdev

SoViT:一种更高效的视觉转换器

**研究团队最新发布的技术论文介绍了SoViT,这是一种针对大小和形状进行了优化的视觉转换器,使用先进的缩放方法,其性能与更大的模型相当,但计算量更少。SoViT在图像分类、字幕生成、视觉问答和零样本转移等各个任...

Read More
2023-06-12 talkingdev

新技术:Matte Anything激发计算机视觉的新火花

近年来,自主车辆研究的减速使计算机视觉领域的进展似乎放缓了。但现在,一种新技术正在让人们看到希望。该技术使用三个图像模型的水螅来增强自然图像抠图的性能,效果非常引人注目。 ## 核心要点: - Matte Anyth...

Read More
2023-06-08 talkingdev

AI现状:14张图表展示现在的AI技术发展趋势

## 新闻概要: 以下是这篇文章中的三个核心点: - 技术的兴衰周期在当今被压缩得非常紧密。传统技术发展18个月的速度,如今在AI的带动下,瞬息万变。 - 资金和人才正在涌入AI领域,这是一个非常有趣的趋势。 - 现...

Read More
2023-06-08 talkingdev

文本到图像模型中的紧急对应关系

最近,研究人员发现文本图像模型(如Stable Diffusion)可以具有紧急对应关系检测能力。这些对应关系是图像中的语义特征,即表示相同的事物,例如人的鼻子,动物的耳朵,汽车的轮胎等。通过巧妙的算法,可以从各种图...

Read More
2023-06-07 talkingdev

研究人员开发了HQ-SAM模型,帮助改善图片分割效果

研究人员开发了HQ-SAM模型,对最近的“Segment Anything Model”(SAM)进行了升级,提高了其轮廓识别复杂结构对象的能力。该模型保留了原有的优点。 ### 核心要点: - 研究人员开发了HQ-SAM模型,对最近的“Segment...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page