LLMs的相关内容 - 漫话开发者

2023-12-12 talkingdev

使用Ollama在本地运行LLMs

Ollama就像是llama cpp模型周围的软件包管理器。它具有易用性和质量生活功能，甚至可以在CPU上轻松运行模型。本示例展示了如何运行两个优秀的模型，Dolphin和Samantha，它们是用于对话任务的优秀未过滤模型。

2023-12-08 talkingdev

本研究介绍了使用大喜利幽默生成游戏来探索LLMs中的跳跃思维能力。这种方法挑战LLMs展现出非连续思维的能力，这是一项对于生成对各种类型的多模式信息具有创造性和幽默感的回应至关重要的技能。

2023-12-08 talkingdev

Lightspeed分享了来自Google和TitanML关于通过提示或微调优化LLMs的内幕。这些技术可以优化自然语言处理模型，从而帮助它们更好地适应真实世界的应用。在这篇文章中，您将了解到这些优化技术的工作原理以及它们如...

2023-12-06 talkingdev

在将语言模型嵌入到您的代码库中时，一个有用的心理模型是将它们视为具有标准输入和输出的函数。这篇博客是由React Native的创始人撰写的，展示了几种您可以这样建模模型以及这种方式的好处。

2023-11-30 talkingdev

近日，llamafile发布了新的GitHub Repo，它是一种新的单文件分发工具，允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行，而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

2023-11-20 talkingdev

使用语言模型构建工具是一种新兴的工程学科，涵盖了高性能计算、GPU编排和监控。在这个领域，LLMs（语言模型）是至关重要的组件，它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

2023-11-17 talkingdev

最近有人在一只填充的鹦鹉上装上了Mistral的7B型号，这在网上引起了轰动。本文深入探讨了他们用来使其运行的基本思想。

2023-11-16 talkingdev

红木研究的一项研究表明，大型语言模型(LLMs)可以掌握“编码推理”，这是一种隐写术，允许LLMs在生成的文本中嵌入中间推理步骤，使它们对人类来说不可解。这种技术可以让模型在不暴露其推理方法的情况下生成高质量的文...