数据集的相关内容 - 漫话开发者

2023-10-27 talkingdev

基于稀疏深度细节的水下车辆实时深度估计模型开源

近日，一项名为‘Real-Time Depth Estimation for Underwater Vehicles’的研究成果在GitHub上发布。该研究提出了一种针对水下车辆的模型，可以通过结合稀疏深度细节从单个图像中实时估计深度。该模型是通过深度学习框...

2023-10-26 talkingdev

VidChapters-7M是一个拥有700万个用户制作章节标记的大型视频集合。这个新的数据集有助于创建和测试将视频分割成章节并为其命名的方法，从而使观众更容易找到他们想要的内容。VidChapters-7M的创建者希望这个工具能...

2023-10-26 talkingdev

Adobe Research推出了一款工具，可以通过结构或文本条件来检索结构化文本文档，这项技术在文档为PDF格式时变得更加困难。此外，Adobe Research还发布了一个基准数据集供进一步研究使用。

2023-10-25 talkingdev

SAM-Med3D是Segment Anything Model（SAM）的升级版，专门针对3D医学影像进行了优化。虽然原始的SAM在处理3D医学影像时存在困难，但是经过对超过131K个3D掩模的广泛数据集进行训练的SAM-Med3D在捕捉3D空间细节方面使...

2023-10-24 talkingdev

本研究评估了大型语言模型（LLMs）在进行类似于人类的多轮对话时的能力。研究人员使用了一种名为Persona-Chat的数据集，该数据集包含有关对话参与者偏好和兴趣的信息。研究结果表明，LLMs在某些方面表现出了与人类类...

2023-10-24 talkingdev

弱监督目标定位通过仅使用简单的图片标签来查找物体。新的背景激活抑制（BAS）方法通过专注于图片的重要部分并忽略其余部分来实现更好的效果，在多个数据集上展现了惊人的结果。

2023-10-24 talkingdev

调整语言模型需要按特定格式创建训练数据。这通常是令人沮丧和缓慢的过程。本文探讨了自动化该过程的简单方法。深度学习模型的表现受到其训练数据的质量的影响。因此，对于特定任务，调整语言模型的能力非常重要。...

2023-10-17 talkingdev

Libgen是许多封闭模型中的数据集。虽然这个数据集的商业使用合法性存在争议，但研究人员仍在使用它来更好地了解语言模型训练数据质量。这个开源的GitHub代码库旨在将Libgen转换为txt文本文档的形式，以便更方便地进...