漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-27 talkingdev

增强版视频对象分割方法:SgMg(GitHub 仓库)

这个GitHub仓库介绍了一个名为SgMg的新方法,改进了视频中所提到的对象分割过程。该方法解决了特性漂移的问题,利用视觉细节更好地优化分割。新方法还使得视频中多个对象的同时分割成为可能,使得这个过程更加快速和...

Read More
2023-07-25 talkingdev

Subject-Diffusion: 提升个性化图像生成的新突破(GitHub仓库

该存储库介绍了主题扩散,这是开放领域个性化图像生成的一项突破性技术。它只需要一个参考图像,而且在测试时不需要进行微调。主题扩散技术的出现,将大幅提升图像生成的效率和准确性,且广泛应用于各类图像生成项目...

Read More
2023-07-19 talkingdev

预训练模型模仿人类行为:图像协调新方法(GitHub仓库

这篇论文提出了一种新的图像协调方法,不同于以往的方法,这种方法并不依赖于大量的合成图像,这使得其训练成本更低,更具泛化性。在以往的方法中,需要大量的合成图像来训练模型,而这篇论文提出的方法,通过预训练...

Read More
2023-07-06 talkingdev

夜间高效无人机追踪系统开源

该研究介绍了SAM-DA,一种能够改善夜间实时追踪无人机(UAV)的新系统。通过使用Segment Anything Model(SAM)从有限的夜间图像中生成详细的训练样本,它显著提高了追踪能力同时使用更少的资源。

Read More
2023-07-05 talkingdev

TypeScript入门指南(GitHub仓库

《TypeScript入门指南》提供了对TypeScript的能力的概述。它涵盖了语言最新版本中的所有方面。该书旨在提升初学者和有经验的开发人员在TypeScript中的理解和能力。

Read More
2023-07-05 talkingdev

S.A.T.U.R.D.A.Y:构建优雅语音接口的工具

S.A.T.U.R.D.A.Y提供了构建优雅语音接口到现代LLMs的工具。

Read More
2023-07-04 talkingdev

一种更真实的三维运动分析新方法(GitHub仓库

该研究介绍了一种新方法,改进了对环境中三维运动的理解,相比现有技术产生了更真实的姿势。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
  1. Prev Page
  2. 10
  3. 11
  4. 12
  5. Next Page