Nebius近日开源了Kvax项目,这是一个基于JAX框架的Flash Attention实现,专门针对长上下文训练场景进行了优化。Kvax通过创新的上下文并行技术和高效的文档掩码计算,实现了更快的训练速度和更高的数据密度压缩,在性...
Read More最新研究发现,当前广泛应用的CLIP(Contrastive Language-Image Pretraining)多模态模型存在严重的安全隐患。根据arXiv最新论文披露,攻击者通过数据投毒(poisoning)方式植入后门,仅需污染0.5%的训练数据即可实...
Read More近日,备受开发者关注的前端动画库AnimeJs正式发布了v4版本,此次更新带来了多项性能优化与新特性。AnimeJs以其轻量级、高性能和易用性著称,广泛应用于Web动画开发。v4版本在核心动画引擎上进行了重构,显著提升了...
Read More加州大学圣克鲁兹分校视觉、语言与行为实验室(VLAA)在GitHub开源了MedReason项目,这是一个专为提升大语言模型(LLM)医疗推理能力构建的大规模数据集。该数据集通过结构化临床案例、医学知识图谱和多模态数据,旨...
Read MoreUniOcc是一个专为自动驾驶场景设计的统一框架,专注于交通流预测和运动轨迹预报。该框架的创新性在于支持多数据集联合训练,并能进行真实环境与合成场景的跨域评估,为自动驾驶系统的决策规划提供更可靠的预测能力。...
Read More腾讯ARC实验室最新发布的SEED-Bench-R1基准测试,为多模态大语言模型(MLLM)在复杂视频任务中的表现提供了系统评估框架。该研究重点关注强化学习(RL)和监督微调(SFT)等后训练方法,揭示了RL在视觉感知任务和数...
Read MoreEasi3R是一项突破性的3D视觉系统,专门针对高动态场景的三维重建进行了优化。该系统通过创新的运动物体掩蔽技术,将移动物体与背景分离学习,从而实现了比现有方法更精确的全场景重建。这一技术解决了动态场景重建中...
Read More强化学习(RL)领域长期存在一个关键问题:是否需要一个足够强大的基础模型来支持涌现式推理能力的形成?最新研究Open-Reasoner-Zero通过系统性实验验证了基础模型对RL推理的重要作用。该研究在多种规模化的RL训练场...
Read More