Llama的相关内容 - 漫话开发者

2024-01-09 talkingdev

对比激活下的Steering Llama 2技术

有很多方式可以对齐语言模型，例如SFT、LoRa、RLHF、DPO、Prompting和Threatening。本研究提出使用负嵌入加到偏置项中，以将模型生成推向期望的结果。

2024-01-03 talkingdev

Llamafile是一个将模型和推理代码嵌入单个便携式可执行文件的项目。此博客探讨了如何将命令行输出导入语言模型以进行进一步处理。

2023-12-25 talkingdev

Facebook发布了一组工具、资源和示例，用于使用Llama模型系列。该工具集可帮助深度学习从业人员更高效地进行模型训练和应用。Llama模型系列由Facebook AI Research开发，已被广泛用于计算机视觉领域。这个工具集将包...

2023-12-12 talkingdev

Ollama就像是llama cpp模型周围的软件包管理器。它具有易用性和质量生活功能，甚至可以在CPU上轻松运行模型。本示例展示了如何运行两个优秀的模型，Dolphin和Samantha，它们是用于对话任务的优秀未过滤模型。

2023-12-11 talkingdev

仅仅在苹果公司推出MLX框架的一天后，人们已经成功将Llama 2模型运行在了新框架上。据悉，这是由于MLX框架的开放性，使得用户可以更加方便地进行模型的迁移和使用。同时，这也展示了MLX框架在机器学习领域的强大性能...

2023-11-30 talkingdev

近日，llamafile发布了新的GitHub Repo，它是一种新的单文件分发工具，允许任何人使用单个文件分发和运行LLMs。LLMs可以在多个CPU微架构上运行，而不需要用户在每个平台上编译。这种工具可以节省开发者的时间和精力...

2023-11-23 talkingdev

使用llama.cpp和GGUF服务器，您可以非常快速地部署一个服务于HuggingFace托管模型的端点。这意味着您可以在几分钟内将HuggingFace的最新自然语言处理模型部署到生产环境中。

2023-11-23 talkingdev

LangChain是一款可以方便地将语言模型集成到您的Go程序中的工具。这包括使用Ollama等框架运行本地模型。