漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-07 talkingdev

采用分层开放词汇学习的图像分割方法 (GitHub Repo)

本论文介绍了HIPIE,一种新颖的图像分割方法,通过将不同的语义层次纳入其学习过程中,解决了复杂场景下的图像分割问题。它在各种图像理解任务中表现优于现有模型,为不同情境下的分割任务提供了统一的解决方案。

Read More
2023-07-06 talkingdev

WebGLM:一种成本效益高的在线问答工具(GitHub开源)

WebGLM是一种由人工智能驱动的新型在线工具,旨在通过搜索网络并提供最相关的信息来回答问题。它通过提供更高的准确性和效率来改进以前的模型,研究表明它的性能与更复杂的系统相当,甚至更好。

Read More
2023-07-06 talkingdev

夜间高效无人机追踪系统开源

该研究介绍了SAM-DA,一种能够改善夜间实时追踪无人机(UAV)的新系统。通过使用Segment Anything Model(SAM)从有限的夜间图像中生成详细的训练样本,它显著提高了追踪能力同时使用更少的资源。

Read More
2023-07-05 talkingdev

TypeScript入门指南(GitHub仓库)

《TypeScript入门指南》提供了对TypeScript的能力的概述。它涵盖了语言最新版本中的所有方面。该书旨在提升初学者和有经验的开发人员在TypeScript中的理解和能力。

Read More
2023-07-05 talkingdev

基于代码的计算机视觉研究平台(GitHub代码库)

Scenic是一个以注意力为核心的计算机视觉研究代码库。

Read More
2023-07-05 talkingdev

S.A.T.U.R.D.A.Y:构建优雅语音接口的工具

S.A.T.U.R.D.A.Y提供了构建优雅语音接口到现代LLMs的工具。

Read More
2023-07-04 talkingdev

一种更真实的三维运动分析新方法(GitHub仓库)

该研究介绍了一种新方法,改进了对环境中三维运动的理解,相比现有技术产生了更真实的姿势。

Read More
2023-07-03 talkingdev

Filtered Guided Diffusion:高效的图生成图方法(GitHub仓库)

这项研究提出了一种名为滤波引导扩散(FGD)的方法,可以在不需要额外训练或更改底层模型的情况下增强图像翻译。FGD根据先前步骤调整扩散过程,并在结构指导和性能方面提供了显著的改进。

Read More
  1. Prev Page
  2. 131
  3. 132
  4. 133
  5. Next Page