Libgen是许多封闭模型中的数据集。虽然这个数据集的商业使用合法性存在争议,但研究人员仍在使用它来更好地了解语言模型训练数据质量。这个开源的GitHub代码库旨在将Libgen转换为txt文本文档的形式,以便更方便地进...
Read More近日,Google推出一款名为“Google-Extended”的新工具,这款工具让网站发布者有权选择阻止他们的数据被用于Google的人工智能训练。这意味着,即使发布者选择不参与AI训练,他们的网站内容仍然可以在Google搜索结果中...
Read MoreChatGPT,开放AI的对话机器人,近日进行了重要的更新。据公告,ChatGPT的训练截止日期已经从2021年9月升级到2022年1月。这意味着ChatGPT的学习和训练数据将包括更多的最近信息和知识。这个更新将使ChatGPT在处理最新...
Read More近期更新的一项工作深入探讨了AI版权的多个角度。AI版权可以广泛地被分类为输入和输出的法律挑战。论文并未提出任何观点,它只是许多常见问题的简要总结。AI版权问题的复杂性在于其涉及到众多领域,包括但不限于技术...
Read More大型语言模型(LLMs)是否具备人类般的推理能力的争论仍在进行中。一方面,有些研究显示,这些模型主要依赖于记忆和模式匹配。另一方面,也有研究显示,它们在与训练数据相关的任务中表现出色,显示出一定的推理能力...
Read More苹果公司正在利用一款内部聊天机器人,以协助员工设计未来的功能特性、进行文本总结以及回答基于其训练数据的问题。通过这种方式,苹果公司能够以更加高效和精准的方式进行工作。这款内部聊天机器人的使用,不仅展示...
Read More近日,多家媒体组织联名发布公开信,呼吁全球立法者考虑制定保护版权的规定,针对用于训练生成性AI模型的数据。他们要求在使用数据进行训练之前,必须对训练数据集进行透明化,并获取权利所有者的同意。公开信还要求...
Read More近日,一款名为SwinMM的新型医疗图像分析方法引起了业界的关注。这种方法通过有效地自我监督利用多视角的信息,即使在训练数据不充足的情况下,也能显著提升医疗图像的分析效果。SwinMM的出现,为医疗图像分析领域带...
Read More