漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-10-31 talkingdev

AMD发布第二轮训练,为大型语言模型训练提供更强的支持

MosaicML发布了一篇关于使用AMD GPU进行大型语言模型训练的文章。该公司在本文中介绍了他们的最新研究结果,使用AMD Radeon Instinct MI100 GPU对GPT-2、GPT-3和T5等大型语言模型进行了训练。结果显示,使用AMD GPU...

Read More
2023-08-21 talkingdev

贝叶斯流网络算法开源

贝叶斯流网络是一种新颖的架构和训练算法。这是一份简洁、非官方的论文复制品。目标是构建一个可以扩展到GPT-2大小模型的代码库。贝叶斯流网络的出现,为深度学习模型的训练带来了新的可能性,其独特的结构和训练方...

Read More
2023-04-08 talkingdev

展示ChatGDB:基于GPT的GDB助手

## 新闻内容: 一位程序员展示了他的新项目ChatGDB,这是一个基于GPT的GDB助手。GDB是一个用于调试C和C++程序的开源工具。ChatGDB的目的是通过自然语言交互简化调试过程。该项目使用了GPT-2和GPT-3模型来生成对用户...

Read More
  1. Prev Page