漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-21 talkingdev

论文:LeMeViT利用可学习的元Token实现快速视觉变换器

最近,一种名为LeMeViT的新方法用于降低视觉变换器中的计算成本,其核心策略是使用可学习的元令牌。这些令牌能够有效地捕获关键信息,从而提高推理速度。视觉变换器在计算机视觉领域有着广泛的应用,然而其计算成本...

Read More
2024-05-20 talkingdev

让LoRA学习更少遗忘更少,优化模型微调调优的新方法

LoRA(Learning of Rate Adjustor)是一种被广泛应用于模型微调的方法,用于注入风格或知识。近期的一篇研究论文深入探讨了在使用LoRA时,学习能力和遗忘之间的权衡关系。研究发现,LoRA相比于全面微调,虽然学习的...

Read More
2024-05-17 talkingdev

MasterWeaver:一种全新的个性化文本到图像生成方法

在技术领域,一种名为MasterWeaver的新方法被提出,以提高个性化文本到图像生成模型的性能。这种技术的出现,无疑为AI领域的图像生成技术开辟了新的可能性,使得文本到图像的转换过程更为精确和个性化。MasterWeaver...

Read More
2024-05-16 talkingdev

改进扰动注意力模型PAG:提升扩散模型的图像质量

扰动注意力指引(PAG)是一种提升扩散模型生成图像质量的新方法,无需额外的训练或外部模块。通过创新地操作模型内部的自我关注机制,PAG显著提高了无条件样本和条件样本的结构和保真度。扩散模型一直以来都是生成对...

Read More
2024-05-13 talkingdev

E2URec开源,让推荐系统“遗忘”用户数据保护隐私

E2URec是一种全新的方法,可以让基于大型语言模型的推荐系统高效、有效地“遗忘”用户数据,保证用户隐私的同时,又不牺牲系统性能。这种新方法以用户隐私保护为核心,通过改变推荐系统的学习机制,实现对用户数据的有...

Read More
2024-05-07 talkingdev

论文:SlotGAT,一种改进异构图神经网络的新方法

SlotGAT是一种新的方法,它通过解决传统信息传递中的语义混合问题,改进了异构图神经网络。在传统的图神经网络中,节点的特征是通过相邻节点的信息来更新的,这种方法在处理同构图时效果良好。然而,在处理异构图时...

Read More
2024-05-03 talkingdev

开源实现扩展LLM大模型到128K上下文长度

一项最新的研究揭示了一种能够显著扩展语言模型上下文长度至128K的方法。这项研究强调了大量和多样性的训练数据的重要性。语言模型的上下文长度是语言模型理解和生成连贯文本的能力的一个重要因素。此项新的研究方法...

Read More
2024-05-03 talkingdev

SUNDAE:有效提升3D渲染质量的新方法

此项目介绍了一种名为SUNDAE的新技术,该技术通过频谱剪枝和神经补偿来提高内存效率。频谱剪枝是一种新颖的技术,通过消除无关紧要的高频信号,以降低存储和计算的需求。神经补偿则是通过学习数据的结构,来预测和补...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page