漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-12 talkingdev

HF发布新基准数据集,用于评估语言模型表现

Hugging Face Hub推出了新的基准数据集,名为Anime Bench,该数据集包含有关各种动漫角色以及引用的事实,旨在评估语言模型的性能。该数据集包含了来自动漫作品的超过10,000个引用,可以用于测试语言模型的能力,评...

Read More
2024-02-12 talkingdev

HF开源轻量级评估库 lighteval

HuggingFace发布了一个轻量级的评估库lighteval,用于基于HELM和Eluther AI评估工具的语言模型训练。该评估库专注于提供高效易用的评估方法和指标,帮助用户快速准确地评估模型性能。同时,lighteval还提供了丰富的...

Read More
2024-02-12 talkingdev

MetaTree:基于Transformer的决策树算法

近日,一种名为MetaTree的新型决策树算法在GitHub上公开发布。与传统的决策树算法不同,MetaTree采用Transformer模型进行学习,从而提高了泛化能力。根据开发者的介绍,MetaTree在多个数据集上进行了测试,结果表明...

Read More
2024-02-12 talkingdev

探究面向生物信息学的Mojo编程语言

Mojo是一种面向生物信息学的编程语言,旨在提供一个易于使用且功能强大的工具来处理大型生物数据集。该语言建立在Perl语言的基础上,为用户提供了一种更简洁,更易于阅读和维护的编程体验。与Perl相比,Mojo语言的语...

Read More
2024-02-09 talkingdev

论文:改进CLIP提高图像分类效率

这篇论文重新审视了经典的高斯判别分析(GDA)算法,以改善CLIP在图像分类任务中的性能,而不需要额外的训练或资源。GDA算法通过增加一个基于贝叶斯公式的先验,实现了对输入向量的加权处理,从而有效地降低了噪声对...

Read More
2024-02-09 talkingdev

Stability AI开发高保真度文本转语音模型,使用合成注释训练

这些文本转语音模型由Stability AI开发,可以通过精确的自然语言指令进行引导。由于没有适合生成的具有正确文本描述的大型数据集,因此其创作者合成注释了大量的语音语料库进行训练。这是注释,上字幕和训练生成模型...

Read More
2024-02-08 talkingdev

论文:CLIP模型使用全合成数据进行训练

由于LAION等大规模数据集的删除,以及版权问题,使得训练大规模图像模型变得具有挑战性。但是,这项工作表明,使用3000万个全合成的图像可以训练出强大的CLIP模型。

Read More
2024-02-07 talkingdev

Nomic-Embed-Text-V1:全新文本嵌入模型的里程碑

Nomic-Embed-Text-V1是一种开源、完全可重现的文本嵌入模型,为短文本和长文本任务树立了新的标杆。在透明度方面独树一帜,Nomic-Embed-Text-V1提供完全访问其训练代码、模型权重和包含2.35亿个文本对的大型数据集的...

Read More
  1. Prev Page
  2. 12
  3. 13
  4. 14
  5. Next Page