边缘设备的相关内容 - 漫话开发者

2025-05-13 talkingdev

Hugging Face发布Vision Language Models最新进展：更小架构实现更强多模态能力

Hugging Face最新技术报告揭示了视觉语言模型(VLM)领域的重大突破。研究表明，通过架构优化，新一代模型在保持较小参数量的同时，显著提升了多模态理解能力。这些进步主要体现在三个方面：复杂场景的推理能力、动态...

2025-05-12 talkingdev

苹果公司近日在GitHub开源了CVPR 2025论文《FastVLM: Efficient Vision Encoding for Vision Language Models》的官方实现代码库。该项目提出了一种高效的视觉编码方法，旨在优化视觉语言模型（VLM）中的视觉信息处...

2025-04-25 talkingdev

近日，自然语言处理领域迎来一项重要技术突破——MiniPLM框架正式发布。该框架创新性地提出了一种高效的小型语言模型（SLM）预训练方法，通过从大型语言模型（LLM）中提取知识进行蒸馏训练，显著提升了小模型的性能表...

2025-04-15 talkingdev

近期发表于arXiv的研究ThinkLite-VL通过创新性地应用蒙特卡洛树搜索（MCTS）技术量化样本难度，在视觉语言模型（VLM）领域取得突破性进展。该方法仅需11,000个训练样本即可显著提升模型推理能力，且无需依赖知识蒸馏...

2025-04-07 talkingdev

Unsloth团队针对DeepSeek最新R1模型成功开发出创新量化方案，其核心突破在于将混合专家（MoE）层压缩至惊人的1.58bit，同时通过动态量化技术保持其他模块在4-6bit精度。研究发现，模型Tokenizer的特殊结构为量化带来...

2025-03-31 talkingdev

近日，GitHub上开源了一个名为Mobile-VideoGPT的轻量级多模态视频模型，其参数量不足10亿（1B），却通过创新的双视觉编码器和令牌剪枝技术，实现了在边缘设备上的实时推理能力。这一突破性进展为移动端和物联网设备...

2025-03-17 talkingdev

近期，OpenAI、微软和Meta等领先的人工智能公司正在通过“蒸馏”技术，利用大型语言模型（LLM）作为“教师”来训练更小的系统，从而创建更具成本效益的AI模型。这种技术通过将复杂模型的知识“蒸馏”到更轻量级的模型中，...

2025-01-21 talkingdev

近期，Hacker News上的一篇帖子引发了社区的热烈讨论，主题是关于小型语言模型（LLM）的创新应用。在这个数据驱动的时代，大型语言模型以其强大的功能和广泛的应用而备受瞩目。然而，小型语言模型以其较小的规模和较...