X的相关内容 - 漫话开发者

2025-05-01 talkingdev

[论文推荐]研究人员发现通过表征控制向量可调节大语言模型推理能力

最新研究表明，通过在大语言模型（LLM）的残差流中实施简单的表征控制向量干预，可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联，为可解释AI领域提供了新工具。...

2025-05-01 talkingdev

小米近日在GitHub上开源了MiMo推理模型项目，该项目旨在解锁语言模型的推理潜力，涵盖从预训练到后训练的全过程。MiMo模型通过优化训练流程和引入新的推理机制，显著提升了语言模型在复杂任务中的表现。这一开源项目...

2025-05-01 talkingdev

近期，安全研究人员披露了一项针对Linux内核中Vsock（虚拟套接字）模块的高危漏洞利用技术。该漏洞允许攻击者在特定条件下绕过安全机制，实现权限提升或系统崩溃，影响范围涉及多个Linux发行版。技术分析显示，攻击...

2025-05-01 talkingdev

作为中国自主x86处理器设计商，兆芯最新发布的KX-7000系列处理器引发行业广泛关注。该处理器采用全新微架构设计，在芯片性能、能效比及指令集兼容性方面实现显著提升，标志着国产CPU在核心技术领域的又一重要突破。...

2025-04-30 talkingdev

微软最新发布的《2025年度工作趋势指数》报告揭示了企业向AI驱动的“前沿企业”（Frontier Firms）转型的重大趋势。报告重点强调了三大核心变革：1）智能随需（intelligence on tap）将成为企业标配，AI能力将像水电一...

2025-04-30 talkingdev

清华大学知识工程组（KEG）与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目，该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...

2025-04-29 talkingdev

来自arXiv的最新研究论文提出ReLearn框架，通过创新的数据增强和微调技术，解决了大语言模型（LLMs）中的关键挑战——'遗忘学习'（Unlearning）。该技术可精准移除模型训练数据中的特定信息，同时保持整体性能，对数据...

2025-04-29 talkingdev

近期发表于arXiv的一篇研究论文提出了一种针对缺失标签的多重填补方法，为机器学习领域中的分类器评估提供了创新解决方案。该方法通过多重填补技术生成预测分布，即使在数据缺失非随机（MNAR）的复杂条件下，仍能保...