微调的相关内容 - 漫话开发者

2024-03-25 talkingdev

Mistral发布7B模型v0.2版本，公布语言模型微调代码

Mistral公司近期举办了一场黑客马拉松活动，并在此期间宣布了其7B语言模型的v0.2版本。同时，Mistral还发布了如何对其语言模型进行微调的代码。这些代码编写得整洁而简明，易于理解和使用。微调代码的发布，将有助于...

2024-03-22 talkingdev

近期，OpenAI推出了GPT-4的微调API，使用户能够创建一个定制版本的GPT-4。这一服务的优势在于，用户可以根据自己的特定需求调整模型，从而在性能上获得高达三倍的提升。不过，这一性能提升并非没有代价，相比于原版G...

2024-03-22 talkingdev

Meta公司近日发布了一个名为Torchtune的原生PyTorch库，专门用于精细调整语言模型。该库旨在为开发者提供更为便捷的工具，以便在PyTorch框架中进行语言模型的微调工作。通过Torchtune，开发者可以更容易地实现模型性...

2024-03-20 talkingdev

近日，GitHub上出现了一个新的项目LlamaGym，该项目专注于通过在线强化学习方法对大型语言模型（LLM）代理进行微调。大型语言模型在近年来取得了显著的进展，但如何进一步提升其性能，尤其是在特定任务上的表现，成...

2024-03-13 talkingdev

谷歌正在为Gemini Web应用程序推出一项新功能，允许用户使用重新生成、更短、更长和删除等选项微调AI生成的响应，目的是提供对创意内容更大的控制。

2024-03-08 talkingdev

Answer AI发布了一款新的FSDP/QLoRA训练工具，可在消费级GPU上训练70B参数模型。该公司开源了代码，并使其易于本地运行或在runpod上运行。

2024-03-01 talkingdev

HiGPT 是一种学习跨异构图谱的方法，不需要微调。它与新颖的图谱分词器和大量的图谱指令相结合，使其在适应各种数据分布方面表现出色。

2024-03-01 talkingdev

Distilabel是为AI工程师设计的框架，使用人类反馈的强化学习方法（例如奖励模型和DPO）对大型语言模型进行对齐。它主要专注于LLM微调和适应性。 Distilabel可协助数据收集，清洗和训练。