一项突破性研究提出让大语言模型通过生成"自我编辑指令"实现持续性参数更新的训练框架。该技术通过监督微调使模型自主产生训练材料,在较小参数量下性能超越GPT-4.1,为解决AI领域的"数据墙"瓶颈提供了新思路。研究...
Read More开发者yousef-rafat在GitHub上开源了miniDiffusion项目,这是一个完全使用PyTorch重新实现的Stable Diffusion 3.5版本。该项目去除了原始实现中的复杂依赖,仅依靠PyTorch框架,使得模型更加轻量化和易于理解。这一...
Read More斯坦福大学研究团队提出突破性框架SEAL(Self-Adapting LLMs),首次实现大型语言模型的自主适应性进化。传统LLM虽功能强大但参数固化,SEAL通过生成自我微调数据和更新指令,使模型能根据新任务、知识或案例动态调...
Read More谷歌旗下DeepMind与谷歌研究院联合推出名为Weather Lab的全新平台,旨在分享其AI气象预测模型的最新成果,其中包括一项实验性的热带气旋预报模型。这一突破性技术将机器学习与气象科学深度融合,通过分析海量气象数...
Read MoreGitHub上近日出现了一个名为Helion的开源项目,该项目旨在使用C#语言构建一个现代化的高速Doom第一人称射击(FPS)游戏引擎。该项目由Helion-Engine团队开发,目前已在GitHub上获得142个点赞和54条评论,显示出开发者...
Read More近日,GitHub上开源了一项名为Weak-to-Strong Decoding(WSD)的创新技术,该方法通过让小型的对齐模型(aligned model)生成回答的开头部分,再由大型基础模型(base model)继续完成后续内容,从而在保持模型性能...
Read MoreMeta近日正式推出V-JEPA 2视觉世界模型,该技术突破性实现了AI代理对物理环境的动态推理能力。作为Yann LeCun团队世界模型研究的最新成果,V-JEPA 2通过自监督学习架构,使AI系统能够基于视频输入预测物理交互结果。...
Read More强化学习预训练(Reinforcement Pre-Training, RPT)作为大语言模型(LLM)与强化学习(RL)协同进化的前沿技术,提出了一种革命性的规模化训练范式。该技术通过创新性地利用海量文本数据进行通用强化学习预训练,在...
Read More