最新研究表明,通过在大语言模型(LLM)的残差流中实施简单的表征控制向量干预,可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联,为可解释AI领域提供了新工具。...
Read More小米近日在GitHub上开源了MiMo推理模型项目,该项目旨在解锁语言模型的推理潜力,涵盖从预训练到后训练的全过程。MiMo模型通过优化训练流程和引入新的推理机制,显著提升了语言模型在复杂任务中的表现。这一开源项目...
Read More近期,安全研究人员披露了一项针对Linux内核中Vsock(虚拟套接字)模块的高危漏洞利用技术。该漏洞允许攻击者在特定条件下绕过安全机制,实现权限提升或系统崩溃,影响范围涉及多个Linux发行版。技术分析显示,攻击...
Read More作为中国自主x86处理器设计商,兆芯最新发布的KX-7000系列处理器引发行业广泛关注。该处理器采用全新微架构设计,在芯片性能、能效比及指令集兼容性方面实现显著提升,标志着国产CPU在核心技术领域的又一重要突破。...
Read More微软最新发布的《2025年度工作趋势指数》报告揭示了企业向AI驱动的“前沿企业”(Frontier Firms)转型的重大趋势。报告重点强调了三大核心变革:1)智能随需(intelligence on tap)将成为企业标配,AI能力将像水电一...
Read More清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...
Read More来自arXiv的最新研究论文提出ReLearn框架,通过创新的数据增强和微调技术,解决了大语言模型(LLMs)中的关键挑战——'遗忘学习'(Unlearning)。该技术可精准移除模型训练数据中的特定信息,同时保持整体性能,对数据...
Read More近期发表于arXiv的一篇研究论文提出了一种针对缺失标签的多重填补方法,为机器学习领域中的分类器评估提供了创新解决方案。该方法通过多重填补技术生成预测分布,即使在数据缺失非随机(MNAR)的复杂条件下,仍能保...
Read More