漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-12 talkingdev

Cohere推出Rerank 3模型,助力企业搜索与RAG升级

Cohere公司近日发布了其最新的基础模型——Rerank 3,专为提升企业搜索和检索增强生成(RAG)系统而设计。该模型兼容任何数据库或搜索索引,并且可以轻松插入到任何具有原生搜索功能的旧版应用程序中。仅需一行代码,R...

Read More
2024-04-09 talkingdev

微软Arm架构Windows笔记本有望超越苹果M3芯片性能

微软计划于5月20日在西雅图举行的活动上展示其对AI PC的愿景。公司对新款Arm架构Windows笔记本充满信心,认为其将在CPU性能和AI加速任务方面超越苹果搭载M3芯片的MacBook Air。这些笔记本将搭载高通的Snapdragon X E...

Read More
2024-04-05 talkingdev

Gretel开源2300万文本至SQL数据集,助力自然语言处理技术发展

HuggingFace平台上新发布了一个由Gretel收集的大规模文本至SQL数据集,包含2300万条数据。该数据集旨在通过自然语言处理技术生成SQL查询语句,对RAG应用程序和合成数据生成领域具有重要意义。文本至SQL的任务一直是...

Read More
2024-04-04 talkingdev

RealKIE发布:五个新型数据集助力企业关键信息提取

企业人工智能应用中,从数据集中提取信息至关重要。RealKIE最新发布的五个基准数据集专为衡量RAG(检索式生成)应用的算法性能而设计。这些数据集覆盖了多个行业和场景,提供了丰富的测试样本,旨在推动企业关键信息...

Read More
2024-03-28 talkingdev

二进制搜索向量技术助力RAG管道性能提升

RAG(检索-生成)管道中,对嵌入向量进行搜索是至关重要的一环。通过将fp32数字替换为单个0或1,并使用KNN聚类器和重排序器,可以在缩小内存需求30倍的同时,保持性能不受影响。这一技术突破为处理大规模数据集提...

Read More
2024-03-22 talkingdev

Cohere推出面向企业级应用的Command-R模型,即将登陆NVIDIA API目录

Cohere近日推出了专为大规模生产而优化的RAG(Retrieval-Augmented Generation)模型Command-R,并宣布将该模型引入NVIDIA新推出的API目录。Command-R模型结合了检索与生成技术,能够助力企业快速进入大规模生产环境...

Read More
2024-02-27 talkingdev

R2R:快速部署生产级RAG系统的框架

R2R是一个半正式框架,旨在快速部署生产级RAG系统。它旨在弥合实验性RAG模型和生产就绪系统之间的差距。R2R为在生产环境中部署、适应和维护RAG管道提供了简单的路径。现已提供短视频演示。

Read More
2024-02-26 talkingdev

基于标注数据的LLM评估指标

本文讨论依赖于真实标注数据的评估指标。它探讨了通用和RAG特定的评估指标。所有指标都带有Python实现或指向一个Hugging Face模型卡的链接。

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page