漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-10 talkingdev

Cohere发布业内领先的嵌入模型

Cohere的最新模型是用于与真实世界的嘈杂数据互动的搜索应用的升级,以及用于检索增强生成(RAG)系统的应用。其多语言模型现在支持100多种语言,并可用于搜索同一语言内的内容(例如,在法国文档上使用法语查询进行...

Read More
2023-11-06 talkingdev

Nous研究使用Yarn方法优化Mistral 7B模型,可处理长达128k的语境

Nous研究利用他们的Yarn方法对Mistral 7B进行了微调,可以处理长达128k的语境。它在短序列长度上显示出最小的退化,并在长文档上大大提高了性能。

Read More
2023-11-03 talkingdev

Nous Research运用Yarn方法,将Mistral 7B模型扩大到128k上下文

Nous Research运用他们的Yarn方法来优化Mistral 7B的性能,使其可以处理长达128k的上下文。该方法在短序列长度上表现良好,并可以显著提高处理长文档的性能。

Read More
2023-10-27 talkingdev

论文:评估GPT-4V的光学字符识别能力

本文研究了大型多模型GPT-4V在各种光学字符识别(OCR)任务中的表现,包括读取场景和手写文本,理解复杂的文档结构等。

Read More
2023-10-26 talkingdev

论文:Adobe Research推出结构化文档检索工具,解决PDF文档检索难题

Adobe Research推出了一款工具,可以通过结构或文本条件来检索结构化文本文档,这项技术在文档为PDF格式时变得更加困难。此外,Adobe Research还发布了一个基准数据集供进一步研究使用。

Read More
2023-10-23 talkingdev

SolidGPT开源,让代码仓库更智能

SolidGPT是一款基于GitHub的人工智能工具,旨在提高代码仓库的智能程度。该工具利用了OpenAI的GPT技术,可以与代码仓库进行交互式对话,从而使用户能够更好地理解和学习代码,提高代码质量和减少错误率。SolidGPT还...

Read More
2023-10-17 talkingdev

Libgen转换为txt的文本数据集开源

Libgen是许多封闭模型中的数据集。虽然这个数据集的商业使用合法性存在争议,但研究人员仍在使用它来更好地了解语言模型训练数据质量。这个开源的GitHub代码库旨在将Libgen转换为txt文本文档的形式,以便更方便地进...

Read More
2023-10-11 talkingdev

如何将文档引入产品生命周期:三种模型对比

本文主要介绍了三种将文档引入产品生命周期的模型,并探讨了针对不同类型的组织,哪种模型最适合。文档在产品生命周期管理中扮演着重要的角色,不仅可以帮助团队理解产品目标和设计,还可以为用户提供使用指南和教程...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page