漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-08 talkingdev

ResFields,时间维度下更深刻理解3D场景

ResFields是一种新型的神经网络,擅长理解随着时间变化的复杂3D场景。通过添加名为‘时间残差层’的组件,它能够处理更多的信息,同时保持准确性。时间残差层的引入,使ResFields在处理大量信息时,不仅能够准确识别3D...

Read More
2023-09-05 talkingdev

SpeechTokenizer,语音模型的统一语音分词器

研究人员创造了一个名为SpeechTokenizer的工具,该工具通过使用一种混合不同语音方面的特殊架构,帮助模型以更有效的方式理解口语。通过这种方式,它尝试解决语音模型在理解和处理口语时面临的挑战。它的创新之处在...

Read More
2023-08-29 talkingdev

Meta AI发布基于虚幻引擎的超真实图形数据集

Meta AI近日公布了一系列利用虚幻引擎进行超真实图像处理的数据集。发布的数据集包括用于基础模型研究的PUG:动物,用于评估图像分类器鲁棒性的PUG:ImageNet,以及用于视觉语言模型评估的PUG:SPAR。这些数据集的发...

Read More
2023-08-15 talkingdev

如果生成型AI被证明是失败的呢?

生成型AI的炒作极其热烈,但它真的值得吗?许多专业人士在ChatGPT发布数月后仍未找到其好的应用场景。在这篇文章中,Gary Marcus探讨了我们对生成型AI将改变世界的假设过于自信的可能性。尽管生成型AI的潜力被广泛宣...

Read More
2023-08-14 talkingdev

SDXL ControlNet:利用边缘控制图像生成的最佳开源模型

图像生成是人工智能技术的一个重要应用场景,而如何更好地控制其生成过程,是业界一直在探索的问题。最佳开源模型SDXL,推出了其ControlNet版本,通过利用边缘来调整最终输出,为图像生成提供了新的解决方案。SDXL C...

Read More
2023-08-08 talkingdev

无分类器引导在HF变压器中的应用(GitHub拉取请求)

无分类器引导是一种引导模型生成的方式。它在图像生成中得到了广泛的应用。同时,它对于文本也同样适用,如今已被纳入Hugging Face模型的`.generate()`方法中。无分类器引导的工作原理是通过对模型的输出进行引导,...

Read More
2023-07-28 talkingdev

Ruby元编程简介

Ruby是一种动态的、面向对象的编程语言,具有强大的元编程能力。元编程是指在运行时修改和扩展程序的能力。Ruby的元编程能力使得开发者可以在运行时动态地创建类、定义方法、修改类的行为等。本文将介绍Ruby中的元编...

Read More
2023-07-24 talkingdev

人工智能领域值得关注的前沿技术及公司

本文为您详细介绍了人工智能的潜在应用场景以及13家可能尚未为您所熟知的行业先锋企业。随着人工智能技术的不断发展和进步,它的应用场景也越来越广泛,如自动驾驶、智能家居、医疗诊断等。这些领域的创新公司正逐步...

Read More
  1. Prev Page
  2. 15
  3. 16
  4. 17
  5. Next Page