漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-19 talkingdev

论文:视觉变换器技术助力水下机器人目标检测能力提升

最新研究项目YOLOX-ViT在水下机器人领域中引入了一种创新的目标检测方法,该方法通过整合视觉变换器(Visual Transformers)和知识蒸馏(Knowledge Distillation)技术,显著提高了目标检测的准确性和效率。该技术的...

Read More
2024-03-18 talkingdev

探索LLM推理的“光速”极限

本文深入探讨了基于变换器的语言模型推理的“光速”理论极限,强调了内存带宽相较于计算能力的重要性。文章通过实例展示了推理速度主要受限于从内存中读取数据的能力,而非执行计算的速度,这对于优化和理解AI性能是一...

Read More
2024-02-22 talkingdev

深入探究:硬核Mamba技术加速

Sasha Rush发布了一份注释教程,介绍了如何使用自定义Triton内核加速Mamba。由于Triton编译器中的一个错误,它目前无法扩展,但它是技术的极端演示,并适合那些想要深入了解状态空间变换器替代品的人。Mamba是一种用...

Read More
2023-10-02 talkingdev

视觉变换器的需求:寄存器

近几周出现的最酷、最简洁的视觉论文之一。视觉变换器使用“无用”的像素值作为存储全局信息的地方,这使得注意力映射变得难以解读。然而,如果你向词汇表中加入一个简单的 [reg] 标记,模型就会使用它,而不会将信息...

Read More
2023-09-19 talkingdev

更高效的微调视觉变换器

对预训练的视觉模型进行特定任务的微调,通常需要大量额外的计算能力。然而,研究人员已经提出了一种名为“显著通道调整”(SCT)的方法,这种方法可以智能地选择模型中需要微调的部分,使用的额外设置要远少于其他方...

Read More
2023-08-09 talkingdev

新型图像增强方式:双聚合变换器(DAT)开源

研究人员已经开发出一种新的方法,叫做双聚合变换器(DAT),该方法通过空间和通道注意力来提升图像的超分辨率效果。DAT使用了诸如自适应交互模块和空间门前馈网络等特殊工具,其性能优于当前的其他方法。空间和通道...

Read More
2023-07-20 talkingdev

RepViT:高效的图像识别架构(GitHub Repo)

研究人员已经开发出一种新型的轻量级神经网络,名为RepViT。该网络通过整合轻量级视觉变换器(Vision Transformers)和传统的卷积神经网络(Convolutional Neural Networks)的高效设计元素而形成。这项技术的开发,...

Read More
2023-07-14 talkingdev

LongLlama - 聚焦变换器训练的开放源码模型(GitHub Repo)

聚焦变换器是一种有趣的检索策略,它使用对比学习来提高key和value的缓存使用。此方法已被证明可相对稳定地扩展到几十万个标记。然而,目前尚不清楚这种方法在大规模应用中的表现如何,或者是否受到其他长期上下文方...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page