研究方向的相关内容 - 漫话开发者

2024-03-28 talkingdev

通过街头霸王游戏测试基准语言模型

语言模型（LLMs）的实用性在于其速度、准确性以及遵循指令的能力。这三个特性使得通过文本输入控制的街头霸王模拟器成为了衡量不同模型在这三个方面表现的绝佳方式。GitHub上的一个项目通过这种方式为LLMs提供了一个...

2024-03-22 talkingdev

PuzzleVQA是一个专为测试大型多模态模型，如GPT-4V的抽象推理能力而设计的数据集。该数据集通过一系列复杂的视觉问题和答案对，评估模型在理解和推理方面的表现。这些问题往往需要模型进行深层次的逻辑思考和抽象概...

2024-03-04 talkingdev

扩散模型将困难问题（比如图像生成）拆分成多个小问题（比如从图像中去除微小的噪点）。单步扩散生成已经得到了很多努力，但似乎这并不符合初衷。本文探讨了扩散蒸馏的悖论，并概述了许多可供研究的方向。

2024-02-13 talkingdev

本文主要讨论人类在数据生成中的作用。人类可以收集偏好数据、进行注释标记等，以提高数据的质量。随着机器学习和人工智能的发展，高质量的人类数据越来越受到重视。本文还探讨了如何让人类数据更加准确、可靠，同时...

2024-02-01 talkingdev

使用较低精度的模型训练速度更快、更便宜，但不稳定。最近有很多关于量化训练的研究。这个代码库建立在这些基础上，提供易于阅读和可修改的代码，实现浮点8训练。

2024-02-01 talkingdev

持续学习是一种机器学习技术，它可以在不断适应新数据的同时保留以前的知识。近年来，随着机器学习技术的不断发展，持续学习技术也得到了越来越多的关注。本文对持续学习的最新进展进行了详细的调查，包括其定义、挑...

2024-01-16 talkingdev

PixArt一直是流行的Stable Diffusion图像生成模型的并行研究方向。本研究采用潜在一致性模型实现更快的生成速度，并采用ControlNet样式提示实现更好的控制。

2024-01-10 talkingdev

视觉Transformer (ViT)已经成为视觉领域的主要研究方向，然而在它们的嵌入中，仍然有时会出现网格状的伪影。这使得社区在将其应用于下游任务时持怀疑态度。本研究提出了一种更新位置嵌入的方法，消除了这一问题，并...