漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-06-09 talkingdev

[论文推荐]PTSD:基于扩散模型的渐进式温度调节采样器

近日,一项名为PTSD(Progressive Tempering Sampler with Diffusion)的新型采样技术在预印本平台arXiv上发布,该技术通过序列化温度调节训练扩散模型,显著提升了从未归一化概率密度中采样的效率。传统方法在复杂...

Read More
2025-06-04 talkingdev

[论文推荐]DIME:基于扩散模型的医疗联合治疗效果预测系统

来自arXiv的最新研究论文提出了一种名为DIME(Diffusion-based Interdependent Medical Effects)的突破性模型,该模型利用扩散模型技术构建医疗领域的联合概率分布预测框架。这项研究通过深度学习中的扩散过程,首...

Read More
2025-05-29 talkingdev

Goodfire推出Paint With Ember工具:通过像素画直接操控AI模型的神经激活

Goodfire公司最新发布的Paint With Ember工具突破了传统文本提示的局限,允许用户通过绘制简单的像素图像直接操控图像模型的神经激活。该工具采用稀疏自编码器技术,将Stable Diffusion XL-Turbo的内部特征解码为可...

Read More
2025-05-27 talkingdev

FoD提出前向扩散生成模型框架:仅需前向步骤实现高效图像生成

近日,FoD研究团队提出了一种基于均值回归随机微分方程的前向生成建模框架(Forward-Only Diffusion)。该技术突破性地实现了非马尔可夫采样过程,在图像生成任务中以更少的迭代步骤达到业界竞争力水平。传统扩散模...

Read More
2025-05-22 talkingdev

谷歌推出Gemini Diffusion:首个采用扩散模型替代Transformer的大语言模型

谷歌最新发布的Gemini Diffusion标志着大语言模型架构的重大突破,这是该公司首次采用扩散模型(Diffusion Model)完全替代传统的Transformer架构。技术文档显示,该模型在保持与Gemini 2.0 Flash-Lite相当性能表现...

Read More
2025-05-16 talkingdev

[论文推荐]BLIP3-o:新型扩散Transformer架构在多模态基准测试中创下最优成绩

BLIP3-o作为一种新型的扩散Transformer架构,通过序列预训练方法实现了技术突破,并在多模态基准测试中取得了当前最优异的成绩。该研究不仅发布了完整的代码和权重文件,还附带了一个包含6万条指令的微调数据集,为...

Read More
2025-05-16 talkingdev

Meta FAIR团队发布支持分子属性预测、扩散建模和语言学习神经科学的新数据集与模型

Meta旗下FAIR(基础人工智能研究)团队近日宣布推出多项重要开源成果,涵盖三大前沿领域:1) 分子属性预测数据集与模型,将加速药物发现与材料科学研发流程;2) 扩散模型(Diffusion Models)相关资源,为当前最热门...

Read More
2025-05-14 talkingdev

[开源]UCGM:统一框架实现连续生成模型的训练与采样

加州大学团队在GitHub开源了UCGM项目,为生成式AI领域带来突破性技术框架。该项目创新性地构建了统一架构,可同时支持多步(如扩散模型)和少步(如流模型)连续生成模型的训练与采样流程。通过数学层面的抽象整合,...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page