漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-11 talkingdev

MambaChat-开源的非Transformer的聊天模型

Mamba是一种非Transformer的模型,其性能惊人。它经过了SFT的聊天调优,并且似乎具有比同等大小的Transformer更好的开箱即用的检索能力。

Read More
2023-12-11 talkingdev

Claude长文本提示

Anthropic最近发布的Claude拥有200k个词汇的上下文。它似乎遭受了语言模型在外部评估中的“迷失在中间”的问题,这意味着它只有27%的标准问题的检索性能。但是,如果在提示中添加句子“助手:这是上下文中最相关的句子...

Read More
2023-12-07 talkingdev

自学习语言模型实现领域自适应

在需要专业知识的领域中使用语言模型时,可以进行微调或使用某些检索技术。但两者都有缺点。这种新颖的方法使用自动生成的合成数据来更好地学习测试时的信息。它在标准适应基准测试中显示出比微调和RAG更好的表现。

Read More
2023-11-15 talkingdev

OpenGPTs:自定义的语言模型、工具和检索算法

OpenGPTs是一个开源项目,构建在LangChain、LangServe和LangSmith之上,提供可定制的语言模型、提示、工具、向量数据库、检索算法和聊天历史数据库。它具有沙盒环境、自定义操作和分析功能,类似于OpenAI的GPTs。Ope...

Read More
2023-11-14 talkingdev

开源GPTs:GitHub仓库OpenGPTs发布

OpenGPTs是一项旨在创建类似于OpenAI's GPTs的技术的仓库。它允许开发人员配置超过60个LLMs,提示,超过100个工具,向量数据库,检索算法和聊天历史数据库。该项目使用LangChain,LangServe和LangSmith。OpenGPTs的...

Read More
2023-11-10 talkingdev

Cohere发布业内领先的嵌入模型

Cohere的最新模型是用于与真实世界的嘈杂数据互动的搜索应用的升级,以及用于检索增强生成(RAG)系统的应用。其多语言模型现在支持100多种语言,并可用于搜索同一语言内的内容(例如,在法国文档上使用法语查询进行...

Read More
2023-11-09 talkingdev

OVIR-3D,可实现即时3D搜索技术开源

OVIR-3D是一项创新技术,可以通过2D图像融合实现从文本提示中检索3D对象,无需3D数据训练,从而实现即时实时搜索功能,非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库,使更多开发者可以在其应用中...

Read More
2023-11-07 talkingdev

基于Rust的矢量数据库Qdrant主打推荐功能

Qdrant是一个基于Rust语言开发的矢量数据库,它使用高速度的矢量检索技术来存储嵌入式向量。近日,Qdrant发布了一个名为“类似帖子”的新功能,它可以使用最相似的向量来搜索数据集。这个功能可以广泛应用于社交网络、...

Read More
  1. Prev Page
  2. 7
  3. 8
  4. 9
  5. Next Page