漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-13 talkingdev

论文:优化数据清洗方案,提高LLMs的训练效果

近日,一项研究提出了一种更好的数据清洗方法,以确保LLMs的公正测试,并提高它们的可靠性。传统的数据清洗方法可能会导致LLMs训练不公平,因为某些数据可能会被错误地标记或过滤掉。这项研究提出的解决方案可以更好...

Read More
2023-11-09 talkingdev

使用Manifold Markets的5000个问题测试GPT-4的准确性,结果显示它的预测存在过度自信现象

近日,一项使用Manifold Markets的5000个问题测试GPT-4准确性的研究结果显示,GPT-4在预测时存在过度自信的现象。研究人员发现,GPT-4所给出的答案在很多情况下都是正确的,但其自信度却远远超过了正确率。这种过度...

Read More
2023-11-08 talkingdev

论文:深度感知技术提升异常检测效果

新技术DADA系统集成3D数据和RGB图像,实现了卓越的表面异常检测,速度和准确度均优于传统方法,无需大量训练数据集。

Read More
2023-11-08 talkingdev

30T多语言开放数据集发布

Red Pajama v2已发布。它比用于训练GPT-4的数据集大2.5倍。它包含5种语言的多语言数据,并具有令人印象深刻的广度。重要的是,已经完成了许多去重工作和一些启发式过滤工作,没有代码数据。

Read More
2023-11-06 talkingdev

开源同理心语言模型,让心理咨询更亲切

研究人员通过创建同理心对话训练数据集的方式,改进了用于心理咨询的大型语言模型的同理心能力。该研究旨在使机器人咨询师更加亲切自然,增加用户的体验感和满意度。目前,该技术已在心理咨询机器人和智能客服中得到...

Read More
2023-11-03 talkingdev

论文:为情感化语言模型调参

研究人员通过创建一个情感对话训练数据集的方式,改进了用于心理咨询的大型语言模型的情感能力。

Read More
2023-10-27 talkingdev

论文:基于开放数据训练的图像扩散模型

最受欢迎的扩散模型,如稳定扩散,已经在各种数据上进行了训练,但其中很多数据受到不同的版权限制。MosaicML提出的这种新模型纯粹基于创意共享数据进行训练,其性能与SD2相当,并且只需要训练数据的一小部分。

Read More
2023-10-26 talkingdev

谷歌AI提供扩展的免责保护

现在,Google为生成式AI产品提供两种免责保护:一种涵盖训练数据使用,保护客户免受第三方知识产权侵权索赔的影响,另一种在采用负责任的AI实践的情况下,为一系列Google Cloud服务生成的输出提供保护。这些措施旨在...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page