ORM的相关内容 - 漫话开发者

2024-05-10 talkingdev

一次缓存，永久有效：YOCO架构再塑GPU内存需求

YOCO架构是一种具有全局注意力能力的解码器-解码器模型，能有效地降低GPU内存需求。它包含一个自解码器和一个交叉解码器，使得关键-值对的缓存和复用更加高效。与传统的Transformer相比，YOCO在推理内存、延迟和吞吐...

2024-05-07 talkingdev

Cohere的Command R和R+是针对长文本任务优化的最新LLM（Large Language Models）。这两款模型在关键的商业重要能力方面表现优异。它们都是目前市场上的技术先行者，并且已经在亚马逊Bedrock平台上进行发布。这无疑是...

2024-05-07 talkingdev

研究人员已经开发出“Morph-Tokens”来提高AI的视觉理解和图像生成能力。这些令牌将用于理解的抽象概念转换为用于图像创建的详细视觉，利用MLLM框架的先进处理能力。Morph-Tokens的开发，不仅能够提高AI的图像理解和生...

2024-05-06 talkingdev

在许多现代性能基准测试中，GPT-4被广泛用作生成质量的评判标准。现在，一种名为Prometheus的模型引起了人们的关注。这种模型是基于Mistral构建的，能够在这项任务上表现出色。Prometheus不仅在处理日常任务上有出色...

2024-05-03 talkingdev

Spikformer V2将自我关注机制与脉冲神经网络（SNNs）的生物效率相结合。这款创新型模型使用了脉冲自我关注机制和卷积茎，增强了其处理视觉特征的能力，同时具有能源效率。脉冲神经网络模拟人脑神经元的工作原理，神...

2024-05-02 talkingdev

如今，多层感知器在人工智能领域得到了广泛的应用，包括在Transformer的关注层之间。然而，它们使用的是固定的激活函数。最新研究论文建议在边缘使用学习的激活函数，利用科尔莫戈洛夫-阿诺德表示法（函数可以由更简...

2024-05-02 talkingdev

理解Transformer的工作原理常常需要多次尝试。本篇博客文章通过详细解读Gemma架构，帮助读者深入理解Transformer。文章内容明了，包含了代码和图解，无论是对于初学者还是专业人士来说，都能从中获取到有价值的信息...

2024-05-01 talkingdev

最近，GitHub仓库上新增了一款名为Phospho的文本分析平台。这款平台主要针对LLM应用进行文本分析，提供了一种全新的处理文本数据的方法。Phospho可以帮助开发者处理大量的文本数据，提取有用的信息，并进行深度分析...