近日,HuggingFace diffusers轻量快速推理引擎在GitHub上线。该引擎通过许多小改进,实现了大幅提升推理速度的目标,声称每秒可达60步,比原来的23步快了许多。该引擎在自然语言处理任务中表现优异,受到了许多开发...
Read More近日,一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型,以贝多芬和凯撒大帝等历史名人为蓝本,通过为它们提供特定的人物资料,从而模拟这些历史人物的语言风格和思想特征。这一技术的...
Read More在自然语言处理领域,语言模型已经取得了重大的突破,但是在数学领域,语言模型的应用却相对较少。Llemma是一种面向数学的开放式语言模型,它基于GPT-3模型,可以处理数学领域的自然语言文本,如数学公式、定理和证...
Read More这个代码仓库探讨了ChatGPT使用的系统消息以及它们如何影响自定义指令。随着ChatGPT的发展,越来越多的用户开始使用它来进行自然语言处理任务。不过,随着使用量的增加,用户反馈也越来越多。为了更好地满足用户需求...
Read More这项研究介绍了一种名为Ex-MCR的新方法,该方法可以有效地学习多个模态的统一对比表示,而无需配对数据。通过对齐现有的多模态对比表示,Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...
Read MoreLibgen是许多封闭模型中的数据集。虽然这个数据集的商业使用合法性存在争议,但研究人员仍在使用它来更好地了解语言模型训练数据质量。这个开源的GitHub代码库旨在将Libgen转换为txt文本文档的形式,以便更方便地进...
Read MoreMemGPT允许开发者创建带有自我编辑记忆的永久聊天机器人。它智能地管理LLMs中的不同记忆层,以有效地提供扩展上下文。MemGPT知道何时将关键信息购买到向量数据库中,以及何时在聊天中检索它,从而实现永久对话。该存...
Read More研究人员使用预训练的扩散模型在较小的图像上进行训练,以生产大尺寸的高质量图像。他们发现在更大的图像中存在重复模式的问题,并将问题指向了模型结构的有限感知能力。
Read More