GitHub的相关内容 - 漫话开发者

2023-10-19 talkingdev

MonoSKD开源，一张图像实现3D物体检测

MonoSKD是一种革命性的方法，它使用一张图像就可以检测3D物体，有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征，而MonoSKD仅需要一张图像就能完...

2023-10-19 talkingdev

系统提示可以改变基于ChatGPT的语言模型的行为。这个代码仓库包含一些非常好的系统提示，可以根据您的偏好改善可用性。

2023-10-18 talkingdev

本研究介绍了LLM4SGG弱监督场景图生成方法，该方法利用大型语言模型的能力，从图像标题中更好地提取和对齐关系，解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

2023-10-18 talkingdev

近日，HuggingFace diffusers轻量快速推理引擎在GitHub上线。该引擎通过许多小改进，实现了大幅提升推理速度的目标，声称每秒可达60步，比原来的23步快了许多。该引擎在自然语言处理任务中表现优异，受到了许多开发...

2023-10-18 talkingdev

近日，一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型，以贝多芬和凯撒大帝等历史名人为蓝本，通过为它们提供特定的人物资料，从而模拟这些历史人物的语言风格和思想特征。这一技术的...

2023-10-18 talkingdev

在自然语言处理领域，语言模型已经取得了重大的突破，但是在数学领域，语言模型的应用却相对较少。Llemma是一种面向数学的开放式语言模型，它基于GPT-3模型，可以处理数学领域的自然语言文本，如数学公式、定理和证...

2023-10-17 talkingdev

这个代码仓库探讨了ChatGPT使用的系统消息以及它们如何影响自定义指令。随着ChatGPT的发展，越来越多的用户开始使用它来进行自然语言处理任务。不过，随着使用量的增加，用户反馈也越来越多。为了更好地满足用户需求...

2023-10-17 talkingdev

这项研究介绍了一种名为Ex-MCR的新方法，该方法可以有效地学习多个模态的统一对比表示，而无需配对数据。通过对齐现有的多模态对比表示，Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...