漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-28 talkingdev

苹果开源的超速视觉转换器ViT

苹果发布的一款超快速视觉转换器ViT在边缘计算部署中表现出色,运行延迟低于1毫秒。这款视觉转换器的优秀性能,使其在面对大量和复杂的视觉信息处理任务时,都能够保持高效的运行状态,为用户提供了更加快速、准确的...

Read More
2023-08-28 talkingdev

微软开源DeepSpeed训练长文本模型

DeepSpeed是微软推出的一个库,可以用来扩大语言模型的预训练。虽然使用起来有些复杂,但它提供了强大的抽象功能。微软最近添加了序列并行性,可以训练具有更长上下文长度的模型。这并不是一个新的突破,而是对开源...

Read More
2023-08-28 talkingdev

精调版Llama编码模型在编码基准测试上超过GPT-4

拥有海量高质量内部数据的公司已发布了精调版Llama,它在编码方面的能力非常高。这是在Meta发布其新的编程语言模型后的几天内完成的。重要的是要注意,当前GPT-4的版本在编码方面仍然优于任何开源模型。本文将新的Ll...

Read More
2023-08-25 talkingdev

开源的AutoML网络应用程序

近日,GitHub平台上发布了一个名为AutoML的网络应用程序。该应用程序是用于训练机器学习管道的工具,它采用了MLJAR AutoML技术。通过这款应用程序,用户可以更方便、快捷地对各种机器学习模型进行训练,无需深入了解...

Read More
2023-08-25 talkingdev

cheetah:开源的多模态语言模型,用于处理视觉-语言任务

近期的模型常常在处理复杂的视觉-语言任务上遇到困难,这主要是由于它们在理解混合的图像-文本上下文时存在限制。为了评估这些任务,研究人员引入了I4基准。结果显示,视觉提示生成器的注意力存在缺陷。为了解决这个...

Read More
2023-08-24 talkingdev

Clip4Cir开源-使用CLIP和标题改进图像搜索

该项目引入了一种搜索图像的方法,该图像看起来像给定的图片,但是在标题中描述了变化。它使用了增加了特殊技巧的CLIP模型。该方法在FashionIQ和CIRR等流行的图像搜索数据集上表现更好。CLIP模型是一个多模态视觉模...

Read More
2023-08-24 talkingdev

TOPIC开源,多目标跟踪新突破并发布复杂动作数据集BEE23

近日,一群研究者开发出一套名为TOPIC的新系统,能够通过运动和外观线索有效地在视频中跟踪多个对象。TOPIC系统不仅能够处理复杂的运动,而且还可以有效处理对象的外观变化,显著提高了多目标跟踪的准确性和效率。为...

Read More
2023-08-24 talkingdev

OneDiffusion:使扩散模型部署更简单可扩展

在生产环境中部署扩散模型一直是一个挑战,因为这些模型难以处理,且计算成本高。但是现在,OneDiffusion的出现旨在使部署和微调变得更易于管理、可扩展且可靠。OneDiffusion是一个开源项目,它的目标是使扩散模型在...

Read More
  1. Prev Page
  2. 82
  3. 83
  4. 84
  5. Next Page