漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品

开源嵌入模型的新阶段

talkingdev • 2024-02-05

653180 views

BGE-M3项目介绍了一种多功能的嵌入模型,其在多功能性(密集、多向量和稀疏检索)、多语言性(支持100多种语言)和多粒度性(处理从短句子到长达8192个标记的文档输入)方面表现优异。它使用混合检索管道,结合不同的方法和重新排序,以提高准确性和泛化能力,并利用其同时执行嵌入和稀疏检索的能力。

核心要点

  • BGE-M3项目介绍了一种多功能的嵌入模型
  • 嵌入模型支持100多种语言
  • 模型能处理从短句子到长达8192个标记的文档输入

Read more >