漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-05 talkingdev

LLM微调Hub:专为使用场景优化的大型语言模型

LLM微调中心是一个包含代码和洞察的平台,专门用于微调各种大型语言模型以适应您的使用场景。不论您是开发者,还是研究人员,甚至是业务决策者,都可以在此找到有用的资源。通过微调,大型语言模型的性能可以得到显...

Read More
2023-09-01 talkingdev

Sparse开源揭示反馈如何影响大型语言模型

在训练大型语言模型以理解和匹配人类价值时,我们是使用评分(rating)还是比较(ranking)作为反馈?这项研究发现,选择的方式对结果影响颇大。例如,通过比较评估时,使用排名训练的模型往往更受青睐,但在打分评...

Read More
2023-08-31 talkingdev

非Llama语言模型的优秀表现

在当今的技术环境中,找到一个不基于Meta基础模型构建的模型是一项挑战。来自Writer的Palmyra模型经过了8000亿令牌和7万条精心策划的指令的训练。它擅长遵循复杂的指令,并且似乎易于进行微调。这种模型的出现,打破...

Read More
2023-08-31 talkingdev

微软发布新型AI训练法“思想算法”

微软发布了一种名为“思想算法”(AoT)的新型AI训练方法,旨在使大型语言模型如ChatGPT的推理能力更加高效和类人化。这种新颖的AI训练方法是微软在人工智能领域的一项重要突破,表明了微软在深化机器学习和人工智能技...

Read More
2023-08-30 talkingdev

开源工具DSPy:可提升语言模型的理解和学习能力

GitHub近日发布了新工具DSPy,这是一套简洁的Python模块集,能够统一调动和微调语言模型(LMs)的技术,并通过推理和工具/检索增强来改进它们。DSPy的设计理念是使得这些复杂的技术可以通过简洁的代码实现,同时也使得...

Read More
2023-08-29 talkingdev

开源视觉-语言模型:识别面部表情

本研究公开了一个新的模型-DFER-CLIP,该模型对CLIP模型进行了改进,专门用于识别现实世界中变化的面部表情。CLIP模型是一个多模态的人工智能模型,它能够理解图像和文本之间的关系。这个新的DFER-CLIP模型,通过增...

Read More
2023-08-29 talkingdev

ChatGPT企业版:安全、私密且强大的语言模型

近日,一款安全且私密的大热语言模型——ChatGPT企业版正式上线。该版本不仅在速度上有着显著提升,性能提高了一倍,而且拥有32000字的上下文长度并且无使用限制。更重要的是,ChatGPT企业版在安全性上也有了重大突破...

Read More
2023-08-29 talkingdev

Meta AI发布基于虚幻引擎的超真实图形数据集

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG:动物,用于评估图像分类器鲁棒性的PUG:ImageNet,以及用于视觉语言模型评估的PUG:SPAR。这些数据集的发...

Read More
  1. Prev Page
  2. 149
  3. 150
  4. 151
  5. Next Page