漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-19 talkingdev

MonoSKD开源,一张图像实现3D物体检测

MonoSKD是一种革命性的方法,它使用一张图像就可以检测3D物体,有效地弥合了LiDAR和普通RGB模型之间的知识鸿沟。传统的3D物体检测需要使用多个传感器来捕捉物体的深度信息和其它特征,而MonoSKD仅需要一张图像就能完...

Read More
2023-10-19 talkingdev

ChatGPT系统提示指南

系统提示可以改变基于ChatGPT的语言模型的行为。这个代码仓库包含一些非常好的系统提示,可以根据您的偏好改善可用性。

Read More
2023-10-18 talkingdev

LLMs在场景图生成中的改进技术应用开源

本研究介绍了LLM4SGG弱监督场景图生成方法,该方法利用大型语言模型的能力,从图像标题中更好地提取和对齐关系,解决了图像标题中捕获详细关系和利用所有可用信息的挑战。

Read More
2023-10-18 talkingdev

HuggingFace diffusers开源轻量快速推理引擎

近日,HuggingFace diffusers轻量快速推理引擎在GitHub上线。该引擎通过许多小改进,实现了大幅提升推理速度的目标,声称每秒可达60步,比原来的23步快了许多。该引擎在自然语言处理任务中表现优异,受到了许多开发...

Read More
2023-10-18 talkingdev

开源Character-LLM,通过LLM模拟贝多芬

近日,一项名为 Character-LLM 的项目在 GitHub 上推出。该项目通过训练大型语言模型,以贝多芬和凯撒大帝等历史名人为蓝本,通过为它们提供特定的人物资料,从而模拟这些历史人物的语言风格和思想特征。这一技术的...

Read More
2023-10-18 talkingdev

论文:Llemma-面向数学的开放式语言模型

在自然语言处理领域,语言模型已经取得了重大的突破,但是在数学领域,语言模型的应用却相对较少。Llemma是一种面向数学的开放式语言模型,它基于GPT-3模型,可以处理数学领域的自然语言文本,如数学公式、定理和证...

Read More
2023-10-17 talkingdev

ChatGPT-AutoExpert幕后故事

这个代码仓库探讨了ChatGPT使用的系统消息以及它们如何影响自定义指令。随着ChatGPT的发展,越来越多的用户开始使用它来进行自然语言处理任务。不过,随着使用量的增加,用户反馈也越来越多。为了更好地满足用户需求...

Read More
2023-10-17 talkingdev

Ex-MCR:无配对数据的多模态学习方法

这项研究介绍了一种名为Ex-MCR的新方法,该方法可以有效地学习多个模态的统一对比表示,而无需配对数据。通过对齐现有的多模态对比表示,Ex-MCR在音频-视频检索和3D物体分类等任务中实现了最佳性能。该方法在GitHub...

Read More
  1. Prev Page
  2. 52
  3. 53
  4. 54
  5. Next Page