漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-18 talkingdev

Video-FocalNet:更优秀的视频识别系统

该项目介绍了Video-FocalNet,这是一个有效而高效的视频识别系统,它将Transformer和卷积模型的优点合二为一。Video-FocalNet采用了独特的方法,能够有效地分析视频的局部和全局上下文,这使得它在多个大型数据集上...

Read More
2023-07-12 talkingdev

TIM新方法提升机器翻译性能,表现超过现有技术

研究人员已经开发出一种名为TIM的新方法,通过向其展示正确和错误的翻译示例,来教导语言模型更好地翻译文本。这种方法在WMT2022数据集上的测试表明,其性能超过了现有的翻译技术。TIM的出现,无疑为机器翻译领域带...

Read More
2023-07-08 talkingdev

提升LLMs问题解决能力的新技术——FLACUNA

最近一份技术报告详细介绍了FLACUNA,这是一种可以提高问题解决能力的语言模型。FLACUNA是通过使用一个名为FLANMINI的自定义指令数据集对VICUNA进行微调而创建的,VICUNA是另一种大型语言模型。FLACUNA的出现,对于...

Read More
2023-07-04 talkingdev

tinyvector:一个快速高效的开源向量数据库

tinyvector是一个小巧而快速的向量嵌入数据库。它非常易于定制,并且在小到中等规模的数据集上具有与先进的向量数据库相当的速度。tinyvector可以轻松扩展到超过1亿个向量维度而不会出现问题。

Read More
2023-06-29 talkingdev

3D-Speaker:一个庞大的语音数据集

3D-Speaker是一个庞大的音频数据集,包含来自10000多个说话者的录音数据,这些录音数据是在不同设备上、各种距离和多种方言下录制的。这个数据集有助于研究人员解析语音的不同方面,并非常适合用于测试大型语音模型...

Read More
2023-06-29 talkingdev

FunQA:专注于惊喜内容的视频问答数据集

FunQA是一个创新的数据集,旨在测试和提升模型对令人惊喜的视频的理解能力,例如幽默或创意视频片段,推动模型在时间戳定位、视频描述和推理等领域的能力。

Read More
2023-06-29 talkingdev

自己的数据上评估LLM的性能

语言模型的性能通常是在一个非常小的筛选数据集上进行评估的。这些数据的分布往往从生产环境中大大简化。使用自我监督评估,您可以使用自己的数据集来评估这些模型。您甚至可以使用从生产环境中流入的数据。

Read More
2023-06-29 talkingdev

FiftyOne:加速机器学习工作流程的利器

FiftyOne是一个强大的工具,可以通过更快、更有效地可视化数据集和解释模型来加速机器学习工作流程。它提供了直观的界面,让用户能够轻松地浏览、筛选和分析数据集。此外,FiftyOne还提供了一系列功能,如数据集的统...

Read More
  1. Prev Page
  2. 33
  3. 34
  4. 35
  5. Next Page