漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-22 talkingdev

AI的初期阶段:从LLMs、Transformer到扩散模型

我们当前的时代正处于一个全新的人工智能阶段,这个阶段的特点是LLMs、变压器和扩散模型的广泛应用。这与以往的人工智能发展阶段有着明显的区别。LLMs是一种复杂的深度学习模型,可以处理大量的数据并预测结果。变压...

Read More
2023-08-21 talkingdev

贝叶斯流网络算法开源

贝叶斯流网络是一种新颖的架构和训练算法。这是一份简洁、非官方的论文复制品。目标是构建一个可以扩展到GPT-2大小模型的代码库。贝叶斯流网络的出现,为深度学习模型的训练带来了新的可能性,其独特的结构和训练方...

Read More
2023-08-18 talkingdev

KernelWarehouse提出一种构建卷积核的更智能方式

KernelWarehouse提出了一种新的动态卷积方法,通过更高效地分解和重组卷积核,为计算机视觉带来了新的可能。这种方法通过在各层之间巧妙地共享和混合预定义的部分,可以使用更少的参数,实现更大的灵活性和强大的功...

Read More
2023-08-17 talkingdev

深度解析:transformer模型训练背后的数学原理

本文将深入探讨热门的《transformer数学101》文章,以及基于transformer架构的高性能分布式训练。变形金刚模型已经在深度学习领域广泛应用,其强大的处理能力和优异的性能表现赢得了业界的一致好评。然而,对于这种...

Read More
2023-08-16 talkingdev

专业的食品图像分割技术开源

虽然段落任意模型(SAM)在各种数据集的分割任务中表现优异,但在面具的特定类别细节上存在疏漏。FoodSAM成功克服了这一问题。它结合了SAM的优势和新的特性,有效地分割食品图像,甚至识别出场景中的单个食品和其他...

Read More
2023-08-15 talkingdev

论文:轻量级RGB-D分割技术助力移动机器人理解环境

有效的RGB-D语义分割可以帮助移动机器人更好地理解他们所在的环境。尽管深度数据提供了有用的几何洞察,但它可能会带来噪声。本文介绍了一种精简的网络,该网络使用的计算功率较少,但仍然稳健,有效地融合了色彩和...

Read More
2023-08-10 talkingdev

提升计算机视觉学生网络的方法开源

深度神经网络在计算机视觉领域有着出色的表现,但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略,能够更好地从老师网络向学生网络传...

Read More
2023-08-08 talkingdev

TorchScale——提供高效有效的Transformers扩展的PyTorch库

TorchScale是一款PyTorch库,让研究者和开发者能够更高效、更有效地扩展Transformers。它是为了满足对于大规模数据处理的需求而生的工具,通过使用TorchScale,我们可以在保持高性能的同时,实现Transformers的扩展...

Read More
  1. Prev Page
  2. 25
  3. 26
  4. 27
  5. Next Page