漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-29 talkingdev

论文:基于Transformer的场景图生成技术问世

研究人员开发出了一种新方法来创建场景图,使该过程更快速和高效。他们基于Transformer的技术专注于改进模型对图像中不同元素的理解和连接方式,从而提高了模型在挑战性任务上的性能。

Read More
2024-01-25 talkingdev

开源RPG框架,改进文本到图像生成质量

最近,由阿里达摩院、南京邮电大学、南京大学等机构合作开发的RPG框架在GitHub上开源。该框架采用“Recaption、Plan和Generate”的方法来改进文本到图像生成,将复杂的图像创建任务分解为更简单的任务,从而在处理多个...

Read More
2024-01-24 talkingdev

2024年,游戏行业的巨大挑战

对于玩家和外界观察者来说,2023年似乎是游戏行业有史以来最伟大的一年之一。有许多顶级游戏发布,硬件发展为游戏体验带来了实质性的改进。然而,这一年对于从业者来说却是残酷的。2023年,游戏行业创下了裁员人数的...

Read More
2024-01-23 talkingdev

论文:BriVIS开放词汇视频实例分割

研究人员开发了BriVIS,一种改进开放词汇视频实例分割(VIS)的方法。通过使用一种称为布朗运动桥的技术,BriVIS保持了物体运动在视频帧之间的上下文,从而实现了更准确的视频和文本对齐。

Read More
2024-01-23 talkingdev

半分钟内运行在大脑中的随机数生成系统

本文介绍了一种在半分钟内在大脑中生成“足够随机”的数字的系统。该系统基于一系列的随机思考实验,通过人类的大脑结构和神经元的触发模式,产生了一种可靠的随机数生成方法。这种系统的应用范围非常广泛,可以应用在...

Read More
2024-01-22 talkingdev

如何提高AI解释的可信度

本项目通过引入两个新版本:Smooth MPRT和Efficient MPRT,改进了模型参数随机化测试,这是eXplainable AI(XAI)中的关键工具。

Read More
2024-01-22 talkingdev

Diffusion模型可用于内容超分辨率

随着最近将扩散模型用于各种其他视觉任务的趋势,本研究改进了超分辨率的训练稳定性和缩放。

Read More
2024-01-22 talkingdev

UV-SAM-探测城市村庄边界的新方法开源

近日,一项名为UV-SAM的新技术通过GitHub仓库公开,该技术是对视觉基础模型和Segment Anything模型的改进,利用卫星图像可以准确识别出城市村庄的边界。与传统的现场调查相比,UV-SAM提供了一种高效的替代方案,结合...

Read More
  1. Prev Page
  2. 17
  3. 18
  4. 19
  5. Next Page