开源的相关内容 - 漫话开发者

2023-08-28 talkingdev

苹果开源的超速视觉转换器ViT

苹果发布的一款超快速视觉转换器ViT在边缘计算部署中表现出色，运行延迟低于1毫秒。这款视觉转换器的优秀性能，使其在面对大量和复杂的视觉信息处理任务时，都能够保持高效的运行状态，为用户提供了更加快速、准确的...

2023-08-28 talkingdev

DeepSpeed是微软推出的一个库，可以用来扩大语言模型的预训练。虽然使用起来有些复杂，但它提供了强大的抽象功能。微软最近添加了序列并行性，可以训练具有更长上下文长度的模型。这并不是一个新的突破，而是对开源...

2023-08-28 talkingdev

拥有海量高质量内部数据的公司已发布了精调版Llama，它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意，当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...

2023-08-25 talkingdev

近日，GitHub平台上发布了一个名为AutoML的网络应用程序。该应用程序是用于训练机器学习管道的工具，它采用了MLJAR AutoML技术。通过这款应用程序，用户可以更方便、快捷地对各种机器学习模型进行训练，无需深入了解...

2023-08-25 talkingdev

近期的模型常常在处理复杂的视觉-语言任务上遇到困难，这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务，研究人员引入了I4基准。结果显示，视觉提示生成器的注意力存在缺陷。为了解决这个...

2023-08-24 talkingdev

该项目引入了一种搜索图像的方法，该图像看起来像给定的图片，但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

2023-08-24 talkingdev

近日，一群研究者开发出一套名为TOPIC的新系统，能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动，而且还可以有效处理对象的外观变化，显著提高了多目标跟踪的准确性和效率。为...

2023-08-24 talkingdev

在生产环境中部署扩散模型一直是一个挑战，因为这些模型难以处理，且计算成本高。但是现在，OneDiffusion的出现旨在使部署和微调变得更易于管理、可扩展且可靠。OneDiffusion是一个开源项目，它的目标是使扩散模型在...