图像识别的相关内容 - 漫话开发者

2024-02-15 talkingdev

Meta计划今年部署自研芯片以推动人工智能发展

Meta计划今年在数据中心部署其自研的新型AI芯片，旨在减少对Nvidia芯片的依赖，控制运行人工智能工作负载的成本。此举将使Meta获得更大的自由度和更高的效率来推动人工智能的发展。Meta的AI芯片将通过对话匹配、图像...

2024-02-15 talkingdev

研究人员引入了一种新的图像分割技术，只使用基本图像标签即可识别图像特定部分，例如狗。他们通过引入一种新的方法来解决网络识别同一对象的多个实例的挑战，并优化了该过程，降低了错误率。

2024-02-13 talkingdev

Phidata是一个使用函数调用构建AI助手的工具包。它不仅可以帮助开发者更快地构建AI助手，还可以通过模块化设计轻松扩展其功能。Phidata基于Python语言，支持各种功能，包括自然语言处理、语音识别和图像识别。它还提...

2024-02-08 talkingdev

由于LAION等大规模数据集的删除，以及版权问题，使得训练大规模图像模型变得具有挑战性。但是，这项工作表明，使用3000万个全合成的图像可以训练出强大的CLIP模型。

2024-02-02 talkingdev

随着人工智能技术的飞速发展，现在AI已经可以在不到一分钟的时间内完成多项任务。这意味着组织和员工必须强调利用AI的好处，而不是坏处。由于AI技术越来越成熟，它可以快速地完成多项任务，例如图像识别，语音识别，...

2024-01-20 talkingdev

苹果公司发布了一篇关于用自回归损失预训练图像模型的论文。它测量了扩展行为，并发现像语言一样，这些大规模无监督的图像模型具有非常可预测的行为。这项技术为图像识别和计算机视觉领域的研究提供了新的思路和方法...

2024-01-10 talkingdev

本项目介绍了开放项目SAM，这是一个结合了CLIP和SAM模型的框架，用于提高图像分割和识别的能力。CLIP模型是一种基于对比学习的神经网络模型，用于学习图像和文字之间的关系，而SAM模型则是一种序列建模方法，用于对...

2024-01-09 talkingdev

V*是一种新的基于图像的搜索算法，可以显著提高GPT-V（和其他VLM）验证码识别性能。这项技术的开发者表示，V*可以通过大量的图像数据来训练模型，从而提高模型的精度。V*算法的另一个优点是它可以将不同的图像元素组...