漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-03-28 talkingdev

[开源]测量视觉模型内部偏差的新方法(GitHub Repo)

近日,一项利用注意力图量化视觉模型内部偏差的新指标在GitHub上开源。该技术通过分析模型在识别过程中的注意力分布,能够有效识别出导致偏差的混淆特征,突破了传统基于群体准确率差异的评估局限。这项名为Attentio...

Read More
2025-03-28 talkingdev

[开源]PET-MAD:基于MAD数据集训练的通用原子间势能模型

PET-MAD是一种基于MAD数据集训练的通用原子间势能模型,能够预测复杂材料建模中的能量和力,适用于元素周期表中的各种元素。这一模型的开发标志着计算材料科学领域的重要突破,为材料模拟和设计提供了更高效、更准确...

Read More
2025-03-27 talkingdev

Dagger:为容器时代量身打造的新型shell工具

近日,一款名为Dagger的新型shell工具引发了技术社区的广泛关注。作为专为容器化时代设计的命令行界面,Dagger旨在解决传统shell在容器环境中遇到的诸多挑战。该工具通过深度整合容器技术,提供了更高效的资源管理、...

Read More
2025-03-27 talkingdev

Ghidra推出MCP服务器,助力逆向工程效率提升

近日,Ghidra正式推出MCP服务器,为逆向工程领域带来新的技术突破。MCP服务器的加入进一步扩展了Ghidra的功能,使其在代码分析、漏洞挖掘等场景中表现更加出色。作为一款开源的逆向工程工具,Ghidra凭借其强大的插件...

Read More
2025-03-26 talkingdev

[开源] 视觉几何基础Transformer (VGGT) GitHub 项目发布

视觉几何基础Transformer(Visual Geometry Grounded Transformer,简称VGGT)是一种前馈神经网络,能够直接从场景的一个、几个甚至数百个视角中推断出所有关键的3D属性,包括外部和内部相机参数、点云图、深度图以...

Read More
2025-03-26 talkingdev

[开源]FastCuRL-1.5B-Preview:通过课程强化学习推动慢思维推理模型的进步

FastCuRL-1.5B-Preview 是一种基于课程强化学习(Curriculum Reinforcement Learning)的慢思维推理模型,该模型在较少的训练步骤中实现了最先进的性能,展示了其在复杂推理任务中的潜力。相比传统方法,FastCuRL 通...

Read More
2025-03-26 talkingdev

开源Dereflection Any Image:基于扩散模型的图像反反射新技术

近日,Dereflection Any Image(DAI)项目推出了一种基于扩散模型的图像反反射新技术,该技术利用高质量数据集和渐进式训练方法,显著提升了图像反反射的效果。反反射技术一直是计算机视觉领域的重要研究方向,尤其...

Read More
2025-03-26 talkingdev

[开源] Video T1:利用引导模型提升视频帧路径物理一致性

Video T1 是一种创新的视频处理技术,通过使用引导模型来拒绝不符合物理规律或用户指定提示的帧路径,显著提升了视频生成的质量。该技术的核心在于测试时计算(test time compute),这一方法在性能基准测试中表现出...

Read More
  1. Prev Page
  2. 8
  3. 9
  4. 10
  5. Next Page