漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-15 talkingdev

论文:保护视觉语言模型的水印方法

在深度学习领域中,视觉语言模型(VLM)越来越受到重视。由于Embedding as a Service Vision-Language Pre-Trained Models(VLPM)中的预训练模型包含了大量的视觉和语言信息,因此这种模型很容易成为恶意攻击的目标...

Read More
2023-11-14 talkingdev

HuggingFace发布对齐手册:Zephyr语言模型实现个性化训练

随着最近发布的优秀Zephyr语言模型,HuggingFace团队展示了如何在少数强大的预训练开源模型基础上训练个性化模型。HuggingFace对齐手册提供了一系列对齐技术的详细解释,并介绍了如何在不同任务上使用预训练模型。此...

Read More
2023-11-08 talkingdev

利用LLM提高推荐系统精度的新方法

近日,研究人员提出了一种名为CLLM4Rec的全新方法,该方法通过高级预训练和新型语言嵌入,将大型语言模型与基于ID的系统相结合,提高了推荐精度。研究人员表示,CLLM4Rec的核心在于将大型语言模型与基于ID的系统相结...

Read More
2023-11-03 talkingdev

论文:使用ChatGPT进行图像分类的研究

这项研究表明,使用大型语言模型将类别组织成层次结构可以提高图像分类的准确性,从而解决预训练模型(如CLIP)中存在的偏差问题,这些模型会混淆相似的类别。

Read More
2023-10-31 talkingdev

Magnetic:轻松将LLM集成到您的Python中

Magnetic是一个用于轻松集成大型语言模型到Python代码的库。 这个名为Magnetic的库是由NLP引擎提供商Hugging Face发布的。基于Transformers,Magnetic允许您轻松地将大型语言模型集成到您的Python代码中,以进行各种...

Read More
2023-10-03 talkingdev

流媒体LLM:一种理论上可以支持无限上下文窗口大小的语言模型算法更新

语言模型的性能往往受到其上下文长度的限制。一般来说,上下文长度的限制主要源于计算硬件和聪明的算法更新。StreamingLLM(Github Repo)提供了一种算法更新,通过将令牌流式传输至注意力机制,理论上可以支持无限...

Read More
2023-07-31 talkingdev

谷歌机器人新突破:transformer模型助力机器人性能全面提升

transformer模型帮助机器人看,帮助机器人计划,甚至帮助机器人控制?看起来,变形金刚正在继续吞噬世界,这是谷歌在机器人技术方面的最新尝试,利用强大的预训练模型改善机器人的各种性能。这一新的尝试使得机器人...

Read More
2023-07-19 talkingdev

预训练模型模仿人类行为:图像协调新方法(GitHub仓库)

这篇论文提出了一种新的图像协调方法,不同于以往的方法,这种方法并不依赖于大量的合成图像,这使得其训练成本更低,更具泛化性。在以往的方法中,需要大量的合成图像来训练模型,而这篇论文提出的方法,通过预训练...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page