近日,研究人员提出了一种名为Sparse-Quantized Representation(SpQR)的新技术,可以实现对大型语言模型(LLMs)的几乎无损压缩,克服了量化带来的精度损失。这项技术使得强大的LLMs可以在像笔记本电脑和手机这样...
Read More研究团队提出了InstructZero,一种新的方法,可以使大型语言模型(LLMs)更好地遵循指令,即使您无法直接调整它们(即“黑盒”模型)。该方法使用“软提示”进行优化,以创建更好的指令。我们的测试表明,在不同任务和各...
Read More本文介绍了一个名为"QLoRA"的开源代码库,旨在支持论文"QLoRA: Efficient Finetuning of Quantized LLMs",该论文旨在民主化LLM研究的资源获取。 ## 三个核心要点: - QLoRA是一个开源代码库,支持LLM研究领域的民...
Read More最近,一篇名为“Activation-aware Weight Quantization (AWQ)”的论文在GitHub上开源。这篇论文提出了一种新的方法,可以更高效地压缩大型语言模型(LLMs),克服了高硬件要求和慢速令牌生成的问题。AWQ可以选择性地...
Read More--- 智能GPT程序是一款能够帮助LLMs使用插件完成复杂任务的程序,现已在GitHub上线。 ### 核心要点 - 智能GPT程序上线GitHub。 - 该程序可为LLMs提供插件来完成复杂任务。 - 这个程序可以提高LLMs的工作效率。
Read More最近的一项研究引入了一种开创性的方法,其中大型人工智能(AI)语言系统(LLMs)不仅被训练使用工具,还可以创建自己的工具以更有效地解决问题。这些LLMs开发了自己的“实用函数”,就像小型软件工具包一样,可以用于...
Read MoreLangchain课程是一个旨在帮助您快速上手使用Langchain的强大开源框架开发应用程序的课程,该框架可以使用大型语言模型(LLMs)如ChatGPT。 ## 核心要点 以下是该新闻的三个核心要点: - Langchain课程现已在GitHu...
Read MoreGorilla模型是基于大型语言模型(LLMs)的一种精细模型,显著优于现有模型如GPT-4在编写API调用方面的表现。它帮助语言模型更有效地使用工具。结合文档检索器,Gorilla可以很好地适应更新的文档,最小化不准确的生成...
Read More