漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-17 talkingdev

[开源]HiRAG:为大型语言模型检索引入分层知识增强生成方法

HiRAG(Hierarchical Retrieval-Augmented Generation)是一种创新的分层知识增强生成方法,旨在提升检索增强生成(RAG)技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型(LLM)...

Read More
2025-03-13 talkingdev

Honey Bunnies:探索AI技术在情感交互中的新应用

近日,Honey Bunnies项目引起了科技界的广泛关注。该项目通过结合LLM(大型语言模型)和agent技术,致力于打造一种全新的情感交互体验。Honey Bunnies的核心在于利用embedding技术,将用户的情感需求转化为机器可理...

Read More
2025-03-04 talkingdev

FlexPrefill推出动态稀疏注意力机制,提升LLM长序列处理效率

近日,FlexPrefill技术通过动态调整稀疏注意力模式和计算预算,显著提升了大型语言模型(LLM)的推理效率。该技术通过查询感知模式确定和累积注意力索引选择,优化了长序列处理的速度和准确性。FlexPrefill的核心在...

Read More
2025-03-03 talkingdev

基于LLMs构建的餐厅与厨师知识图谱亮相

近日,一项基于LLMs(大型语言模型)构建的餐厅与厨师知识图谱项目在技术社区中引起了广泛关注。该项目通过利用LLMs的强大自然语言处理能力,成功地将全球范围内的餐厅与厨师信息整合到一个统一的知识图谱中。这一知...

Read More
2025-02-28 talkingdev

CoT-UQ框架:为大型语言模型引入链式思维不确定性量化

近日,GitHub上发布了一个名为CoT-UQ的创新框架,该框架旨在为大型语言模型(LLM)提供响应层面的不确定性量化。CoT-UQ通过集成链式思维(Chain-of-Thought, CoT)推理,能够更精确地评估模型在生成响应时的置信度。...

Read More
2025-02-27 talkingdev

LLM推理能力研究:System 2思维在大型语言模型中的应用

近期,一项针对OpenAI的o1/o3和DeepSeek的R1等推理型LLM的研究揭示了这些模型在逐步逻辑推理能力方面的表现。研究通过对比人类认知能力,对这些模型进行了基准测试。结果显示,尽管LLM在复杂任务中表现出色,但在需...

Read More
2025-02-26 talkingdev

LLM开源项目:AI玩转《Pokémon》游戏

近日,一个名为'LLM plays Pokémon'的开源项目在技术社区引发了广泛关注。该项目利用LLM(大型语言模型)技术,成功实现了AI自主玩转经典游戏《Pokémon》。通过结合LoRA(低秩适应)和RAG(检索增强生成)等技术,该...

Read More
2025-02-21 talkingdev

开源框架DeepEval助力大型语言模型系统评估

DeepEval是一个开源框架,专注于评估和测试大型语言模型系统。它整合了最新的研究成果,通过本地运行的模型来评估模型输出。DeepEval支持通过RAG、微调、LangChain、LlamaIndex等多种方式实现的应用。该框架可帮助开...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page