漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-11 talkingdev

利用Google Cloud TPUs调优LLaMa3.1的创新方案

在技术社区中,近日有开发者分享了利用Google Cloud TPUs对LLaMa3.1进行调优的经验和方法。这一过程不仅展示了TPUs在处理大型模型时的卓越性能,还强调了调优过程中的一些关键技术细节。调优LLaMa3.1的过程中,开发...

Read More
2024-07-11 talkingdev

Korvus:基于Postgres的单查询RAG

Korvus是一种基于Postgres的新型工具,它可以实现单查询RAG技术。这种技术可以提高数据库的查询效率和准确性,特别是在处理大规模数据时。Korvus的开发者表示,它可以让用户以更直观的方式了解数据库中不同表之间的...

Read More
2024-06-20 talkingdev

开源Dot:让本地LLMs和TTS/RAG交互更便捷

近日,一个名为Dot(GitHub Repo)的开源应用引起了大家的关注。这是一个独立的开源应用,其主要目的是让用户更轻松地使用本地LLMs(语言模型)和RAG(重新生成的注意力引导)来与文档和文件进行交互。这种交互方式...

Read More
2024-03-22 talkingdev

Cohere推出面向企业级应用的Command-R模型,即将登陆NVIDIA API目录

Cohere近日推出了专为大规模生产而优化的RAG(Retrieval-Augmented Generation)模型Command-R,并宣布将该模型引入NVIDIA新推出的API目录。Command-R模型结合了检索与生成技术,能够助力企业快速进入大规模生产环境...

Read More
2023-09-13 talkingdev

行星级规模的检索增强生成技术

Arcus公司通过使用分层检索器将检索增强生成(RAG)技术扩展到行星级规模。这种技术是通过将文件基于其语义内容进行分组聚类,然后逐步过滤这些组来缩小搜索空间。这样可以检索到更相关的上下文,减少幻觉,并在行星...

Read More