语言模型的相关内容 - 漫话开发者

2023-09-05 talkingdev

LLM微调Hub：专为使用场景优化的大型语言模型

LLM微调中心是一个包含代码和洞察的平台，专门用于微调各种大型语言模型以适应您的使用场景。不论您是开发者，还是研究人员，甚至是业务决策者，都可以在此找到有用的资源。通过微调，大型语言模型的性能可以得到显...

2023-09-01 talkingdev

在训练大型语言模型以理解和匹配人类价值时，我们是使用评分（rating）还是比较（ranking）作为反馈？这项研究发现，选择的方式对结果影响颇大。例如，通过比较评估时，使用排名训练的模型往往更受青睐，但在打分评...

2023-08-31 talkingdev

在当今的技术环境中，找到一个不基于Meta基础模型构建的模型是一项挑战。来自Writer的Palmyra模型经过了8000亿令牌和7万条精心策划的指令的训练。它擅长遵循复杂的指令，并且似乎易于进行微调。这种模型的出现，打破...

2023-08-31 talkingdev

微软发布了一种名为“思想算法”（AoT）的新型AI训练方法，旨在使大型语言模型如ChatGPT的推理能力更加高效和类人化。这种新颖的AI训练方法是微软在人工智能领域的一项重要突破，表明了微软在深化机器学习和人工智能技...

2023-08-30 talkingdev

GitHub近日发布了新工具DSPy，这是一套简洁的Python模块集，能够统一调动和微调语言模型(LMs)的技术，并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现，同时也使得...

2023-08-29 talkingdev

本研究公开了一个新的模型-DFER-CLIP，该模型对CLIP模型进行了改进，专门用于识别现实世界中变化的面部表情。CLIP模型是一个多模态的人工智能模型，它能够理解图像和文本之间的关系。这个新的DFER-CLIP模型，通过增...

2023-08-29 talkingdev

近日，一款安全且私密的大热语言模型——ChatGPT企业版正式上线。该版本不仅在速度上有着显著提升，性能提高了一倍，而且拥有32000字的上下文长度并且无使用限制。更重要的是，ChatGPT企业版在安全性上也有了重大突破...

2023-08-29 talkingdev

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG：动物，用于评估图像分类器鲁棒性的PUG：ImageNet，以及用于视觉语言模型评估的PUG：SPAR。这些数据集的发...