漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-07-19 talkingdev

训练模型模仿人类行为:图像协调新方法(GitHub仓库)

这篇论文提出了一种新的图像协调方法,不同于以往的方法,这种方法并不依赖于大量的合成图像,这使得其训练成本更低,更具泛化性。在以往的方法中,需要大量的合成图像来训练模型,而这篇论文提出的方法,通过预训练...

Read More
2023-07-06 talkingdev

NanoT5:新一代高效训练模型的开源项目

我们之前在新闻通讯中提到过这个项目,但它刚刚进行了升级。受到Andrej的优秀NanoGPT项目的启发,NanoT5项目可以以比T5论文性能更快150倍的速度训练模型。如果你关心从头开始训练模型,那么这个项目绝对值得一看。

Read More
2023-06-30 talkingdev

Boba AI-如何构建基于LLM的生成应用程序

这是一个有趣的案例研究,介绍了如何构建一个基于LLM技术的生成应用程序。在这个案例中,开发团队使用了先进的自然语言处理技术,通过训练模型来生成波霸奶茶相关的内容。他们通过收集大量的波霸奶茶相关数据,并使...

Read More
2023-06-23 talkingdev

FlagAI:快速、易用且可扩展的大规模通用人工智能模型工具包开源

FlagAI(Fast Large-scale General AI models)是一个快速、易于使用且可扩展的大规模模型工具包。它提供了一整套功能强大的工具和库,用于开发和部署大规模人工智能模型。FlagAI的设计目标是使开发人员能够快速构建...

Read More
2023-06-19 talkingdev

斯坦福的基础模型框架

从头开始训练基础模型是一项具有挑战性的任务。斯坦福大学的语言模型团队发布了一个在Jax上的框架,使这个过程更加简化。它提供了多种数据和模型并行策略,简化了编程过程。

Read More
2023-06-14 talkingdev

为AI初创企业提供2K H100 GPU

据报道,一些知名天使投资者为初创企业建立了一个巨大的计算机集群,以便其用于训练模型。该集群提供了2K H100 GPU。 ## 内容要点: 以下是该新闻的三个核心要点: - 一些知名天使投资者为初创企业建立了一个计算...

Read More
2023-06-09 talkingdev

中文视频理解领域的重量级数据集发布(GitHub仓库)

近日,一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍,这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下,借助这个数据集和创新的...

Read More
2023-06-07 talkingdev

近1000亿多语言法律语料库

近日,一个包含24种语言的大型法律文件语料库到来。同时,已提供训练模型和训练代码。他们发现,在这个689GB的语料库上训练的模型可以实现法律语言模型的最新技术水平。 ## 新闻内容: 以下是该新闻的三个核心要点...

Read More
  1. Prev Page
  2. 5
  3. 6
  4. 7
  5. Next Page