漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-28 talkingdev

QA-LoRA的智能构建和微调方法,让LLM更快更小

大型语言模型在许多设备上的运行效率受限于其庞大的计算需求。然而,一个名为QA-LoRA的新方法已经成功改变了这一局面。QA-LoRA通过巧妙地改变模型的构建和微调方式,使得大型语言模型能够在维持强大功能的同时,有效...

Read More
2023-09-21 talkingdev

OpenPipe开源,将昂贵的提示工程转为更低价模型

OpenPipe是一种基于少数提示行为的模型简化工具。在当前的人工智能领域,模型的训练和部署往往需要大量的计算资源和时间,这对许多用户来说是一种负担。然而,OpenPipe的出现改变了这一状况。它通过利用少数提示行为...

Read More
2023-09-06 talkingdev

BLoRA开源,同一GPU上批量处理LoRAs

LoRAs是一种小型的参数适配器,通过插入到某些层次来改变底层模型的行为。你可以为基础模型进行批量生成,以提高性能。此外,你还可以对LoRA修改后的模型进行批量处理,并向不同的用户提供具有不同性能的模型。这种...

Read More
2023-08-17 talkingdev

使用GPT模型优化GitHub仓库的提交信息

在软件开发中,提交信息起着至关重要的作用,但很多提交信息都缺乏详细的描述。最近有一篇论文提出了一个新的方法,利用过去的提交历史,而非简单地生成提交信息。这篇论文提出了一个新的数据集,名为CommitChronicl...

Read More
2023-07-11 talkingdev

创新模型DPC-DUN:使图像修复更快更好

这项研究介绍了动态路径可控的深度展开网络(DPC-DUN),这是一种创新的模型,优化了压缩感测(CS)中的图像重建,平衡了性能和复杂性,以提高效率和结果。DPC-DUN模型通过动态路径控制,实现了对算法的灵活配置和优化,...

Read More
2023-06-27 talkingdev

LLM Library (GitHub Repo):打造大型机器学习模型优化的可扩展工具箱

LLM Library是一款可扩展、便捷、高效的大型机器学习模型微调工具箱,旨在为整个社区提供用户友好、高速可靠、易于访问的解决方案。

Read More
2023-06-15 talkingdev

SoViT:一种更高效的视觉转换器

**研究团队最新发布的技术论文介绍了SoViT,这是一种针对大小和形状进行了优化的视觉转换器,使用先进的缩放方法,其性能与更大的模型相当,但计算量更少。SoViT在图像分类、字幕生成、视觉问答和零样本转移等各个任...

Read More
  1. Prev Page