漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2025-04-01 talkingdev

TIDE:水下场景理解新突破,高质量合成数据集生成方法

近日,一项名为TIDE的创新技术在水下场景理解领域取得重要进展。该技术通过文本到图像转换和密集标注生成方法,能够创建具有一致像素级标签的高质量合成数据集。这一突破性技术解决了水下场景数据获取难、标注成本高...

Read More
2024-04-09 talkingdev

论文:AI图像生成技术新突破,提示自动编辑技术助力文本到图像转换

近期,研究人员开发了一种名为提示自动编辑(Prompt Auto-Editing,简称PAE)的新技术,旨在提升基于文本生成图像的技术水平。该技术利用了Imagen和Stable Diffusion等扩散模型,通过在线强化学习动态调整文本提示中...

Read More