文本数据的相关内容 - 漫话开发者

2023-07-28 talkingdev

推出Tidepool：面向AI应用的产品分析工具

AI基于文本的接口为我们与软件交互开辟了一种全新的方式，但是在非结构化文本中寻找洞察力却十分困难。Tidepool就是为解决这一问题而生，它能在用户的文本交互中找出模式，帮助你做出更好的产品决策。AI在许多领域已...

2023-06-27 talkingdev

Kor是一种新的技术，它利用LLMs（Language Learning Models）从文本中提取结构化数据。LLMs是一种能够理解和处理自然语言的模型，它们可以对文本进行深度分析，找出其中的关键信息和结构。Kor通过使用LLMs，可以将文...

2023-06-21 talkingdev

AI模型的训练数据质量对于获得良好性能非常重要。在代码模型中，数据去重往往非常重要。对于文本而言，目前尚不清楚它是否同样重要。然而，无论如何，本博客介绍了用于去重文本样式数据的技术。

2023-06-21 talkingdev

Autolabel是一个Python库，可以使用你选择的任何大型语言模型（LLM）来标注、清理和丰富文本数据集。

2023-06-16 talkingdev

Meta AI首席科学家Yann LeCun表示，像ChatGPT这样的当前AI系统远远没有达到人类水平的智能水平，将它们与狗的能力相提并论。在Viva Tech大会上的一次讨论中，LeCun强调，AI对文本数据之外的真实世界现象的缺乏理解是...

2023-06-09 talkingdev

近日，一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍，这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下，借助这个数据集和创新的...

2023-06-01 talkingdev

在 CLIP、Whisper 和 LLaMA 的基础上，Macaw-LLM 探索性地开发了一种多模态语言模型，无缝结合了图像、视频、音频和文本数据。以下是该新闻的三个核心要点： - Macaw-LLM 是一种多模态语言模型 - 它结合了图像、...

2023-04-16 talkingdev

新闻内容： - 研究人员正在使用33TB的文本数据训练一个1T参数模型，这是迄今为止最大的模型之一。 - 这个模型将用于自然语言处理，如语义理解和机器翻译，以提高模型的准确性和语义理解能力。 - 这项工作突破了以前...