Giskard是一个开源的测试框架,用于测试从表格到LLMs的机器学习模型。它通过检查模型的输出和真实值之间的差异来评估模型的性能。Giskard不仅可以测试模型的预测能力,还可以测量它的稳定性、可解释性和鲁棒性。Gisk...
Read MoreOllama就像是llama cpp模型周围的软件包管理器。它具有易用性和质量生活功能,甚至可以在CPU上轻松运行模型。本示例展示了如何运行两个优秀的模型,Dolphin和Samantha,它们是用于对话任务的优秀未过滤模型。
Read More本研究介绍了使用大喜利幽默生成游戏来探索LLMs中的跳跃思维能力。这种方法挑战LLMs展现出非连续思维的能力,这是一项对于生成对各种类型的多模式信息具有创造性和幽默感的回应至关重要的技能。
Read MoreLightspeed分享了来自Google和TitanML关于通过提示或微调优化LLMs的内幕。 这些技术可以优化自然语言处理模型,从而帮助它们更好地适应真实世界的应用。 在这篇文章中,您将了解到这些优化技术的工作原理以及它们如...
Read More在将语言模型嵌入到您的代码库中时,一个有用的心理模型是将它们视为具有标准输入和输出的函数。这篇博客是由React Native的创始人撰写的,展示了几种您可以这样建模模型以及这种方式的好处。
Read More近日,llamafile发布了新的GitHub Repo,它是一种新的单文件分发工具,允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行,而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...
Read More使用语言模型构建工具是一种新兴的工程学科,涵盖了高性能计算、GPU编排和监控。在这个领域,LLMs(语言模型)是至关重要的组件,它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...
Read More