预训练的相关内容 - 漫话开发者

2023-11-30 talkingdev

论文：创新方法增强手语视频隐私保护

DiffSLVA是一种创新的手语视频匿名化方法，可以在保留语言内容的同时进行隐私保护。该技术使用预训练的扩散模型和专门的面部表情模块，克服了以前的限制，不需要精确的姿势估计。

2023-11-16 talkingdev

MonoDiffusion是一种新的自监督单目深度估计框架，其独特的方法将深度估计问题视为迭代去噪过程。它利用预训练的教师模型指导伪地面真值扩散过程，从而提高深度图精度，无需在训练中使用实际的深度真值。

2023-11-15 talkingdev

在深度学习领域中，视觉语言模型（VLM）越来越受到重视。由于Embedding as a Service Vision-Language Pre-Trained Models（VLPM）中的预训练模型包含了大量的视觉和语言信息，因此这种模型很容易成为恶意攻击的目标...

2023-11-14 talkingdev

随着最近发布的优秀Zephyr语言模型，HuggingFace团队展示了如何在少数强大的预训练开源模型基础上训练个性化模型。HuggingFace对齐手册提供了一系列对齐技术的详细解释，并介绍了如何在不同任务上使用预训练模型。此...

2023-11-14 talkingdev

这项研究提出了3DStyle-Diffusion模型，这是一种用于对3D网格进行细节风格化的新方法，整合了2D扩散模型以增加对外观和几何形状的控制。它通过首先使用隐式MLP网络将3D网格的纹理参数化为反射和照明，然后使用预训练...

2023-11-08 talkingdev

近日，研究人员提出了一种名为CLLM4Rec的全新方法，该方法通过高级预训练和新型语言嵌入，将大型语言模型与基于ID的系统相结合，提高了推荐精度。研究人员表示，CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...

2023-11-03 talkingdev

这项研究表明，使用大型语言模型将类别组织成层次结构可以提高图像分类的准确性，从而解决预训练模型（如CLIP）中存在的偏差问题，这些模型会混淆相似的类别。

2023-10-31 talkingdev

Magnetic是一个用于轻松集成大型语言模型到Python代码的库。这个名为Magnetic的库是由NLP引擎提供商Hugging Face发布的。基于Transformers，Magnetic允许您轻松地将大型语言模型集成到您的Python代码中，以进行各种...