漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-05-07 talkingdev

[论文推荐]Chain of Draft:高效推理新范式,显著降低计算成本

近日,一项名为Chain of Draft的创新推理策略在arXiv预印本平台引发关注。该技术通过精简推理路径设计,在保持与经典Chain-of-Thought方法相当甚至更高准确率的前提下,显著降低了大型语言模型的token消耗量。实验数...

Read More
2025-05-05 talkingdev

基于注意力蒸馏的扩散模型图像风格化方法取得新突破

近日,一项名为'Attention Distillation for Diffusion-Based Image Stylization'的技术在图像生成领域取得重要进展。该技术通过利用预训练扩散模型中的自注意力特征,创新性地引入了注意力蒸馏损失函数,有效优化了...

Read More
2025-05-05 talkingdev

[论文推荐]FUSED提出高效联邦遗忘机制:可逆且低成本的稀疏遗忘适配器

联邦学习领域迎来突破性进展,FUSED(Federated Unlearning with Sparse Efficient Deletion)系统通过创新的稀疏遗忘适配器技术,首次实现了联邦学习环境下的定向知识擦除与可逆操作。该技术通过在模型微调层植入轻...

Read More
2025-04-29 talkingdev

[论文推荐]ReLearn:大语言模型高效遗忘学习的数据增强与微调方案

来自arXiv的最新研究论文提出ReLearn框架,通过创新的数据增强和微调技术,解决了大语言模型(LLMs)中的关键挑战——'遗忘学习'(Unlearning)。该技术可精准移除模型训练数据中的特定信息,同时保持整体性能,对数据...

Read More
2025-04-15 talkingdev

字节跳动团队发布Seaweed-7B:以低成本训练高性能视频生成基础模型

字节跳动团队最新发布的论文展示了如何在655k H100小时的“适度”计算预算下,训练出一个具有竞争力的70亿参数视频生成模型Seaweed-7B。该模型在多项时间敏感任务中表现出色,展现了强大的视频生成能力。这一突破不仅...

Read More
2025-04-02 talkingdev

[开源]Easi3R:无需训练即可从DUSt3R中解耦运动估计(GitHub项目)

Easi3R是一项突破性的3D视觉系统,专门针对高动态场景的三维重建进行了优化。该系统通过创新的运动物体掩蔽技术,将移动物体与背景分离学习,从而实现了比现有方法更精确的全场景重建。这一技术解决了动态场景重建中...

Read More
2025-04-01 talkingdev

[开源]扩散模型最优步长研究(Optimal Stepsize in Diffusion Models)实现10倍加速

GitHub最新开源项目Optimal Stepsize for Diffusion Sampling (OSS)通过动态规划算法优化了扩散模型的采样步长调度方案。这项突破性技术能在保持生成质量近乎无损的情况下,将采样速度提升10倍。该研究解决了扩散模...

Read More
2025-03-28 talkingdev

[论文推荐]Guidance-Free Training:无需分类器引导的视觉生成模型训练新方法

近日,一项名为Guidance-Free Training(GFT)的技术突破引发计算机视觉领域关注。该技术通过完全消除对Classifier-Free Guidance(CFG)的依赖,在保持生成质量的同时显著降低计算成本。与传统基于蒸馏的方法不同,...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page