漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-06-24 talkingdev

模型大小与说服力呈对数缩放关系的证据

一种被称为'超级说服'的担忧正在困扰着人们,那就是随着模型的不断增大,它们的说服力会显著增强。但是,有弱证据表明更大的模型并不比较小的模型更具有说服力。然而,它们可能可以被调整以增强说服力。这种现象提醒...

Read More
2024-05-27 talkingdev

论文:研究人员推出基于分类器引导的图像个性化扩散模型

研究人员提出了一种新的方法,通过使用分类器引导来定制扩散模型,从用户提供的参考图像中生成保持身份特征的图像。与传统方法需要大量特定领域的训练不同,这种技术利用分类器引导扩散模型,无需额外的训练。此方法...

Read More
2024-05-15 talkingdev

Google发布PaliGemma优化模型

Google在今天的发布中公布并展示了一些开源模型。其中一个已经发布的模型是基于SigLIP的视觉语言模型。这个模型非常容易调整和扩展到多种任务。这个Colab笔记本展示了如何用简洁、易读的代码来实现这一点。SigLIP是...

Read More
2024-02-23 talkingdev

Lorax-多LoRA模型推理服务器开源

Lorax是一款支持将多个LoRA模型热插拔到单个基础模型上的推理服务器。这意味着在支持广泛的模型调整范围的同时,RAM内存占用会大幅减少。

Read More
2023-09-28 talkingdev

RL在扩散模型上的应用库

利用RL调整语言模型正逐渐成为模型部署流程中的标准步骤。现在,这将通过扩散模型以及DRLX的发布变得更加容易,DRLX允许用户指定奖励模型或使用预定义的模型。扩散模型通过简化了RL在语言模型调整中的实现,为AI技术...

Read More