训练模型的相关内容 - 漫话开发者

2023-07-19 talkingdev

预训练模型模仿人类行为：图像协调新方法（GitHub仓库）

这篇论文提出了一种新的图像协调方法，不同于以往的方法，这种方法并不依赖于大量的合成图像，这使得其训练成本更低，更具泛化性。在以往的方法中，需要大量的合成图像来训练模型，而这篇论文提出的方法，通过预训练...

2023-07-06 talkingdev

我们之前在新闻通讯中提到过这个项目，但它刚刚进行了升级。受到Andrej的优秀NanoGPT项目的启发，NanoT5项目可以以比T5论文性能更快150倍的速度训练模型。如果你关心从头开始训练模型，那么这个项目绝对值得一看。

2023-06-30 talkingdev

这是一个有趣的案例研究，介绍了如何构建一个基于LLM技术的生成应用程序。在这个案例中，开发团队使用了先进的自然语言处理技术，通过训练模型来生成波霸奶茶相关的内容。他们通过收集大量的波霸奶茶相关数据，并使...

2023-06-23 talkingdev

FlagAI（Fast Large-scale General AI models）是一个快速、易于使用且可扩展的大规模模型工具包。它提供了一整套功能强大的工具和库，用于开发和部署大规模人工智能模型。FlagAI的设计目标是使开发人员能够快速构建...

2023-06-19 talkingdev

从头开始训练基础模型是一项具有挑战性的任务。斯坦福大学的语言模型团队发布了一个在Jax上的框架，使这个过程更加简化。它提供了多种数据和模型并行策略，简化了编程过程。

2023-06-14 talkingdev

据报道，一些知名天使投资者为初创企业建立了一个巨大的计算机集群，以便其用于训练模型。该集群提供了2K H100 GPU。 ## 内容要点：以下是该新闻的三个核心要点： - 一些知名天使投资者为初创企业建立了一个计算...

2023-06-09 talkingdev

近日，一份论文发布了有关优酷视频数据集Youku-mPLUG的介绍，这是目前公开的最大中文视频-文本数据集。该数据集由来自视频共享平台Youku的一千万个精选视频-文本对组成。在研究人员的努力下，借助这个数据集和创新的...

2023-06-07 talkingdev

近日，一个包含24种语言的大型法律文件语料库到来。同时，已提供训练模型和训练代码。他们发现，在这个689GB的语料库上训练的模型可以实现法律语言模型的最新技术水平。 ## 新闻内容：以下是该新闻的三个核心要点...