大型语言模型的相关内容 - 漫话开发者

2025-03-20 talkingdev

Zoom的AI进化：从基础会议工具到基于LLMs和SLMs的智能生产力平台

Zoom正通过开发一套自主AI基础设施，将其业务从视频会议扩展到行动导向的工作流程。这一创新包括AI Companion 2.0，它提供了任务管理和文档创建等功能，以及通过新的AI Studio定制的AI代理。Zoom采用联合方法，将公...

2025-03-18 talkingdev

Funsearch是一种基于大型语言模型（LLM）驱动的遗传算法新实现，旨在帮助数学家解决组合和数论问题，而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力，为数学研究提供了全新...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-17 talkingdev

HiRAG（Hierarchical Retrieval-Augmented Generation）是一种创新的分层知识增强生成方法，旨在提升检索增强生成（RAG）技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型（LLM）...

2025-03-13 talkingdev

近日，Honey Bunnies项目引起了科技界的广泛关注。该项目通过结合LLM（大型语言模型）和agent技术，致力于打造一种全新的情感交互体验。Honey Bunnies的核心在于利用embedding技术，将用户的情感需求转化为机器可理...

2025-03-04 talkingdev

近日，FlexPrefill技术通过动态调整稀疏注意力模式和计算预算，显著提升了大型语言模型（LLM）的推理效率。该技术通过查询感知模式确定和累积注意力索引选择，优化了长序列处理的速度和准确性。FlexPrefill的核心在...

2025-03-03 talkingdev

近日，一项基于LLMs（大型语言模型）构建的餐厅与厨师知识图谱项目在技术社区中引起了广泛关注。该项目通过利用LLMs的强大自然语言处理能力，成功地将全球范围内的餐厅与厨师信息整合到一个统一的知识图谱中。这一知...

2025-02-28 talkingdev

近日，GitHub上发布了一个名为CoT-UQ的创新框架，该框架旨在为大型语言模型（LLM）提供响应层面的不确定性量化。CoT-UQ通过集成链式思维（Chain-of-Thought, CoT）推理，能够更精确地评估模型在生成响应时的置信度。...