训练数据的相关内容 - 漫话开发者

2023-11-09 talkingdev

使用Manifold Markets的5000个问题测试GPT-4的准确性，结果显示它的预测存在过度自信现象

近日，一项使用Manifold Markets的5000个问题测试GPT-4准确性的研究结果显示，GPT-4在预测时存在过度自信的现象。研究人员发现，GPT-4所给出的答案在很多情况下都是正确的，但其自信度却远远超过了正确率。这种过度...

2023-11-08 talkingdev

新技术DADA系统集成3D数据和RGB图像，实现了卓越的表面异常检测，速度和准确度均优于传统方法，无需大量训练数据集。

2023-11-08 talkingdev

Red Pajama v2已发布。它比用于训练GPT-4的数据集大2.5倍。它包含5种语言的多语言数据，并具有令人印象深刻的广度。重要的是，已经完成了许多去重工作和一些启发式过滤工作，没有代码数据。

2023-11-06 talkingdev

研究人员通过创建同理心对话训练数据集的方式，改进了用于心理咨询的大型语言模型的同理心能力。该研究旨在使机器人咨询师更加亲切自然，增加用户的体验感和满意度。目前，该技术已在心理咨询机器人和智能客服中得到...

2023-11-03 talkingdev

研究人员通过创建一个情感对话训练数据集的方式，改进了用于心理咨询的大型语言模型的情感能力。

2023-10-27 talkingdev

最受欢迎的扩散模型，如稳定扩散，已经在各种数据上进行了训练，但其中很多数据受到不同的版权限制。MosaicML提出的这种新模型纯粹基于创意共享数据进行训练，其性能与SD2相当，并且只需要训练数据的一小部分。

2023-10-26 talkingdev

现在，Google为生成式AI产品提供两种免责保护：一种涵盖训练数据使用，保护客户免受第三方知识产权侵权索赔的影响，另一种在采用负责任的AI实践的情况下，为一系列Google Cloud服务生成的输出提供保护。这些措施旨在...

2023-10-24 talkingdev

本研究评估了大型语言模型（LLMs）在进行类似于人类的多轮对话时的能力。研究人员使用了一种名为Persona-Chat的数据集，该数据集包含有关对话参与者偏好和兴趣的信息。研究结果表明，LLMs在某些方面表现出了与人类类...