数据集的相关内容 - 漫话开发者

2024-03-01 talkingdev

论文：AI模型的视觉感知能力得到提升

本研究致力于提高基于多模态的GPT-4V等模型在低级视觉感知任务中的表现。大规模实验从58,000名人类受试者中收集了18,973张图像的反馈，并创建了Q-Pathway数据集，以分析其清晰度、色彩和亮度。

2024-02-28 talkingdev

FlowMDM是一种新的模型，用于从文本描述生成长时间连续的人体运动序列。这种首创的扩散模型使用混合位置编码进行逼真的运动创建，无需额外的去噪步骤，在关键数据集上表现出卓越的准确性和逼真度。

2024-02-28 talkingdev

由数据质量研究专家创立的 DatalogyAI 公司最近获得了1100万美元的融资。该公司旨在让数据集的可扩展筛选变得更加简单。

2024-02-27 talkingdev

OpenCodeInterpreter模型基于CodeLlama和DeepSeek Coder，通过训练合成多轮数据集和使用人类反馈，能够在编程HumanEval基准测试中获得85%以上的准确率。

2024-02-23 talkingdev

Meta发布了MMCSG数据集，其中包含数千个通过Aria眼镜记录的双向对话，旨在鼓励在各种社交音频和视觉任务中的研究。

2024-02-20 talkingdev

研究人员创建了OpenMathInstruct-1，这是一个用于训练开源大型语言模型数学的新数据集，可与闭源模型的性能相匹配。这一突破包含180万个问题解决对，为更加可访问和有竞争力的数学教学AI工具打开了大门。

2024-02-16 talkingdev

近日，一种名为Video Annotator的框架已经在GitHub上发布。该框架通过将领域专家直接融入注释过程中，利用零样本学习和主动学习技术提高模型的精度和效率。这种注释方法不仅提高了模型的分类准确度，而且可以更好地...

2024-02-14 talkingdev

群体混淆智能（MMI）的概念代表了从传统的单一AI扩展向基于分布式、基于代理的系统的模型的转变，这些系统可以实时学习和适应。MMI的理念根植于具体化、边界智能、时间性和个体性的原则，倡导强调具有一定自主性和相...