SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法,使用户能够更好地控制生成的文本。此外,它还提供了一些实用工具,如生成...
Read More自然语言处理(NLP)中,让语言模型生成自己的训练数据是一个具有挑战性但前景广阔的研究领域。SPIN是一种方法,已经显示出很大的前途。该代码已经发布,但据报道使用起来很有挑战性。
Read MoreLaion研究小组发布了一款开放式助手BUD-E,该助手采用自然语言和极度优化的语言模型,可在游戏笔记本电脑上运行。该项目旨在提供一种低资源的助手,易于安装且对个人使用功能强大。
Read More本研究着眼于一个基于大型语言模型的国际象棋AI是如何工作的。该AI使用了GPT-2和GPT-3模型,并通过对棋盘上的棋子和动作进行编码来训练自己。研究人员还探索了AI模型内部的世界,包括其理解和预测对手的能力,以及在...
Read MoreHugging Face Hub推出了新的基准数据集,名为Anime Bench,该数据集包含有关各种动漫角色以及引用的事实,旨在评估语言模型的性能。该数据集包含了来自动漫作品的超过10,000个引用,可以用于测试语言模型的能力,评...
Read MoreCogCoM是一种全新的通用视觉语言模型,它具有独特的操作链机制。这使得它能够通过主动调整输入图像来处理多轮视觉推理。该模型已经在GitHub上发布。
Read MoreHuggingFace发布了一个轻量级的评估库lighteval,用于基于HELM和Eluther AI评估工具的语言模型训练。该评估库专注于提供高效易用的评估方法和指标,帮助用户快速准确地评估模型性能。同时,lighteval还提供了丰富的...
Read MoreFunSearch是一种新的AI驱动方法,它将大型语言模型与评估算法相结合,已经在数学科学领域做出了可验证的发现,包括解决了长期存在的cap set问题和更高效的bin-packing问题算法。它引入了演化方法来生成和评估代码,...
Read More