GitHub代码库的相关内容 - 漫话开发者

2024-04-10 talkingdev

Visual Autoregressive Models：图像生成高分辨率解决方案

Visual Autoregressive Models是一个新的GitHub项目，它将图像生成视为逐步预测更高分辨率的过程。该代码库包含了用于下一分辨率预测工作的推理脚本和演示笔记本。虽然训练代码将很快公开，但目前该项目已经引起了技...

2024-02-09 talkingdev

Google提出了一种新颖的提示技术，允许语言模型使用一组推理基元来发现更大的问题特定推理框架。这意味着模型可以选择不同的模块并将它们组合起来以更好地解决复杂问题。这个代码库是这些想法的一个非官方实现。

2023-12-05 talkingdev

SAFE是一种新的模式识别融合框架，它结合了预训练的视觉和语言模型，使用RGB帧、事件流和语义标签进行融合。该框架能够通过各种传感器收集的数据来识别和理解环境中的对象和场景，具有广泛的应用前景。在实现过程中...

2023-11-20 talkingdev

近日，一份名为AI Exploits的GitHub仓库发布，其中包含了一系列真实世界中的AI/ML漏洞利用案例，以帮助人们更好地了解和防范这些漏洞。这个项目的目标是通过公开这些案例来增加人们对AI/ML漏洞的认识，同时也希望能...

2023-11-09 talkingdev

OVIR-3D是一项创新技术，可以通过2D图像融合实现从文本提示中检索3D对象，无需3D数据训练，从而实现即时实时搜索功能，非常适合机器人应用。该技术的最新成果是在GitHub上发布了代码库，使更多开发者可以在其应用中...

2023-11-03 talkingdev

Cohere AI的研究部门For AI开发了用于混合专家模型的参数高效微调方法，称为MoE PEFT。该算法可显著提高模型的微调效率，同时保持准确性。最近，该团队公开了该算法的GitHub代码库，为社区提供更多研究资源和工具。C...

2023-10-31 talkingdev

这篇论文介绍了一种名为IC⁠TC的基于文本条件的图像聚类方法，该方法利用视觉语言模型根据用户提供的文本描述对图像进行排序。IC⁠TC方法使用了预训练的视觉语言模型来生成图像和文本之间的嵌入，然后使用这些嵌入来聚...

2023-10-18 talkingdev

本研究介绍了LLM4SGG弱监督场景图生成方法，该方法利用大型语言模型的能力，从图像标题中更好地提取和对齐关系，解决了图像标题中捕获详细关系和利用所有可用信息的挑战。