漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-01 talkingdev

PyTorch调试指南:帮助您高效解决常见问题

PyTorch是构建模型的强大工具。然而,在实际使用中,一些常见的bug可能会大幅降低模型的性能。为此,我们提供了一份实用的列表,帮助您在调试模型代码时找到问题并解决。该列表内容详尽、实用性强,无论是在建模过程...

Read More
2024-07-01 talkingdev

深入探讨:训练MoEs模型

Mosaic团队已与PyTorch合作,撰写关于如何扩展他们的MoEs模型至数千个GPU的文章。MoEs,全称Mixture of Experts,是一种深度学习的模型结构,其核心思想是将复杂的问题分解为若干个相对简单的子问题,然后由专家系统...

Read More
2024-06-11 talkingdev

Coqui.ai TTS:一款用于文本转语音的深度学习工具包

Coqui.ai TTS是一款用于文本转语音的深度学习工具包,它支持多种语言和声音风格,并可在较低的计算资源上实现高质量的语音合成。该工具包基于TensorFlow 2和PyTorch,是一款开源、易于使用的工具,可帮助研究人员和...

Read More
2024-05-13 talkingdev

音频扩散AudioDiff:ElevenLabs科学家新作开源

在科技日新月异的今天,ElevenLabs的一位研究科学家发布了一个名为音频扩散PyTorch的GitHub仓库,该仓库可能成为复制令人惊叹的结果的起点。这个仓库是基于PyTorch的音频扩散实验,旨在通过开源的方式,让更多的音频...

Read More
2024-05-07 talkingdev

Unsloth.ai:轻松微调和训练LLMs的新方式

Unsloth.ai的创始人近期发布了一段视频,详述了他们的团队如何使用PyTorch,编写他们的内核,以及设计他们的API界面。Unsloth的框架和库功能强大,易于使用。Unsloth通过这种方式,使得大量的开发者能够更好地进行深...

Read More
2024-04-29 talkingdev

Torchtitan:Meta的全新Llama模型预训练框架开源

近日,Meta推出了全新的Llama模型预训练框架——Torchtitan。该框架是完全使用PyTorch编写的,具有高度的灵活性和易用性。对于广大的PyTorch用户和开发者来说,这是一个利好消息。Meta是全球最大的社交网络公司,其在...

Read More
2024-04-11 talkingdev

Rewriting PyTorch nn in Triton,开创神经网络实验库新篇章

Attorch项目旨在用Python和Triton重新编写PyTorch的nn模块部分代码,创建一个易于修改且性能卓越的神经网络实验库。这一尝试标志着以往成本过高的编写工作现在变得可行。Attorch的设计允许研究人员和开发者轻松进行...

Read More
2024-04-09 talkingdev

用C/CUDA语言训练大型语言模型,无需依赖PyTorch

近期,Andrei Karpathy推出了一个名为llm.c的项目,该项目展示了如何使用C和CUDA编程语言来训练大型语言模型(LLM)。这一创新方法避免了对PyTorch等大型深度学习框架的依赖,尤其是其所需的250MB以上的资源。这种训...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page