LLM的相关内容 - 漫话开发者

2025-03-18 talkingdev

[开源]面向语音的多模态LLM框架MMS-LLaMA发布

MMS-LLaMA是一款高效的多模态语音大语言模型框架，专注于自动视觉语音识别（AVSR），在优化标记长度的同时保留了语言内容。该框架通过整合视觉和语音数据，提供了一种全新的方法来提升语音识别的准确性和效率。MMS-L...

2025-03-18 talkingdev

Funsearch是一种基于大型语言模型（LLM）驱动的遗传算法新实现，旨在帮助数学家解决组合和数论问题，而无需具备机器学习的专业知识。这项创新技术通过结合遗传算法的优化能力与LLM的生成能力，为数学研究提供了全新...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-03-17 talkingdev

HiRAG（Hierarchical Retrieval-Augmented Generation）是一种创新的分层知识增强生成方法，旨在提升检索增强生成（RAG）技术在特定领域任务中的语义理解和索引能力。RAG技术通过将外部知识库与大型语言模型（LLM）...

2025-03-16 talkingdev

近日，DiceDB作为一款新兴的数据库技术，正在迅速引起业界的广泛关注。DiceDB以其高效的数据处理能力和灵活的架构设计，为现代数据管理带来了全新的解决方案。该数据库不仅支持大规模数据存储与实时分析，还通过创新...

2025-03-15 talkingdev

随着技术的飞速发展，2025年的职业市场将迎来前所未有的变革。LLM、agent、embedding、LoRA和RAG等技术的广泛应用，正在重塑各行各业的职业需求。专家预测，未来的职业发展将更加依赖于技术能力，尤其是对新兴技术的...

2025-03-14 talkingdev

近日，GitHub上发布了一个名为REF-VLM的开源项目，该项目通过引入基于三元组的结构化表示，统一了多模态大语言模型（LLMs）中的视觉解码任务。多模态LLMs是当前人工智能领域的前沿技术，能够在处理视觉和文本信息时...

2025-03-13 talkingdev

近日，Steam Networks在游戏网络技术领域取得了重大突破。通过优化网络架构和引入先进的LLM技术，Steam Networks成功提升了游戏的实时交互体验。该技术不仅减少了延迟，还通过agent和embedding技术增强了游戏的智能...