漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-01 talkingdev

[论文推荐]研究人员发现通过表征控制向量可调节大语言模型推理能力

最新研究表明,通过在大语言模型(LLM)的残差流中实施简单的表征控制向量干预,可显著调节其推理性能。这项发表于arXiv的突破性研究揭示了神经网络内部表征与逻辑推理能力的直接关联,为可解释AI领域提供了新工具。...

Read More
2025-05-01 talkingdev

小米MiMo推理模型开源:解锁语言模型的推理潜力

小米近日在GitHub上开源了MiMo推理模型项目,该项目旨在解锁语言模型的推理潜力,涵盖从预训练到后训练的全过程。MiMo模型通过优化训练流程和引入新的推理机制,显著提升了语言模型在复杂任务中的表现。这一开源项目...

Read More
2025-05-01 talkingdev

Linux内核漏洞利用:Vsock攻击技术深度解析

近期,安全研究人员披露了一项针对Linux内核中Vsock(虚拟套接字)模块的高危漏洞利用技术。该漏洞允许攻击者在特定条件下绕过安全机制,实现权限提升或系统崩溃,影响范围涉及多个Linux发行版。技术分析显示,攻击...

Read More
2025-05-01 talkingdev

国产x86处理器新突破:兆芯KX-7000架构深度解析

作为中国自主x86处理器设计商,兆芯最新发布的KX-7000系列处理器引发行业广泛关注。该处理器采用全新微架构设计,在芯片性能、能效比及指令集兼容性方面实现显著提升,标志着国产CPU在核心技术领域的又一重要突破。...

Read More
2025-04-30 talkingdev

微软2025年度工作趋势报告:AI驱动的“前沿企业”崛起

微软最新发布的《2025年度工作趋势指数》报告揭示了企业向AI驱动的“前沿企业”(Frontier Firms)转型的重大趋势。报告重点强调了三大核心变革:1)智能随需(intelligence on tap)将成为企业标配,AI能力将像水电一...

Read More
2025-04-30 talkingdev

CogView 4图像生成模型发布:性能超越Flux模型,开放许可引关注

清华大学知识工程组(KEG)与智谱AI联合推出的CogView 4最新一代生成式图像模型近日在Hugging Face平台正式发布。作为采用宽松许可协议的开源项目,该模型在图像质量、生成效率和多模态理解等核心指标上显著超越当前...

Read More
2025-04-29 talkingdev

[论文推荐]ReLearn:大语言模型高效遗忘学习的数据增强与微调方案

来自arXiv的最新研究论文提出ReLearn框架,通过创新的数据增强和微调技术,解决了大语言模型(LLMs)中的关键挑战——'遗忘学习'(Unlearning)。该技术可精准移除模型训练数据中的特定信息,同时保持整体性能,对数据...

Read More
2025-04-29 talkingdev

[论文推荐] 多重填补方法处理缺失标签:MNAR条件下的稳健分类器评估

近期发表于arXiv的一篇研究论文提出了一种针对缺失标签的多重填补方法,为机器学习领域中的分类器评估提供了创新解决方案。该方法通过多重填补技术生成预测分布,即使在数据缺失非随机(MNAR)的复杂条件下,仍能保...

Read More
  1. Prev Page
  2. 108
  3. 109
  4. 110
  5. Next Page