漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-24 talkingdev

DepthAnything:通过大规模数据集提高单目深度估计精度

Depth Anything是一种新的单目深度估计方法,它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督,该模型实现了令人印象深刻的泛化能力,并在深度估计方面树立了新的标准...

Read More
2024-01-20 talkingdev

开源项目:针对新物体的实例分割模型

近日,一款名为Instance Segmentation for Novel Objects的GitHub开源项目备受关注。该项目旨在评估深度学习模型在实例分割方面对新物体的泛化能力。通过该项目,用户可以训练自己的实例分割模型,并对模型进行评估...

Read More
2024-01-15 talkingdev

论文:自我监督学习提高歌声合成相似度和泛化性能

研究人员开发了一种新的框架来更好地理解和分析歌声。通过在孤立的人声轨道上进行自我监督学习,并专注于域外泛化,他们在歌声相似性和合成等任务上取得了进展,从而改进了现有技术。这种新方法可以通过对歌声的不同...

Read More
2024-01-09 talkingdev

用提示增强的视觉语言模型开源

这项项目介绍了一种方法,可以适应各种任务的类似CLIP的视觉语言模型,同时保留其泛化能力。该方法从LLM数据中学习提示,避免了需要标记图像的需求。

Read More
2023-12-22 talkingdev

论文:使用2D标记点进行3D结构重建的新模型问世

新的3D-LFM模型采用变压器从2D标记点重建3D结构,无需“对应”3D数据。这种方法是首个这样处理不同点数量、遮挡并且具有泛化能力的方法。

Read More
2023-12-18 talkingdev

OpenAI超级对齐团队新成果:从弱到强泛化

OpenAI超级对齐团队最新成果表明,您可以使用更弱的监督模型来引导或对齐更强大的模型,类似于弱人类对齐超级智能模型。他们使用GPT-2恢复了GPT-4的大部分对齐性能。他们指出,这种方法具有可行的路径,可以实现显著...

Read More
2023-12-15 talkingdev

FIND多用途AI模型接口开源,提升图像和数据理解能力

FIND推出了一个多用途AI模型接口,使得AI模型能够更好地理解图像和数据集,而无需更改核心模型。该接口使用了一种新的嵌入对齐方法,能够将不同任务的嵌入空间对齐起来,从而提高模型的泛化能力。这一技术的研发背后...

Read More
2023-11-02 talkingdev

神经网络具有类人的泛化语言能力

研究人员开发出一种神经网络,可以像人类一样泛化语言,胜过ChatGPT等模型。该研究结果发表在最新的AI会议上,研究人员对该神经网络进行了广泛的测试,证明它在各种语言任务中都表现出色。这一发现为自然语言处理领...

Read More
  1. Prev Page
  2. 3
  3. 4
  4. 5
  5. Next Page