ORM的相关内容 - 漫话开发者

2023-06-30 talkingdev

MusicGen: 简化音乐生成的一种新方法开源

Audiocraft推出MusicGen，这是一种简化和增强音乐生成的模型。这种单阶段的自回归Transformer模型不需要像之前的方法那样进行自监督语义表示，通过并行预测所有码本，它更高效地生成音乐，从而每秒音频的步骤更少。

2023-06-26 talkingdev

ExLlama是HF Transformers实现的一种内存更高效的量化权重重写。这个重写的目的是为了在使用量化权重时能够更好地节省内存。Llama是HF Transformers的一个开源项目，但在使用量化权重时存在内存占用较高的问题。ExLl...

2023-06-22 talkingdev

随着Transformer的不断流行，使用频率远远超过训练。这可能会非常慢和昂贵，但通过在GPU上进行一些巧妙的内存布局优化，它们可以获得多倍的加速。

2023-06-08 talkingdev

## 新闻内容： GitHub开源社区发布了一款名为CodeTF的Python Transformer库，致力于提高代码智能化的水平，为使用者提供了一个训练与推理的平台，可以轻松实现代码智能化任务，如代码摘要、翻译、生成等。 CodeTF...

2023-06-05 talkingdev

近日，谷歌通过基因搜索算法和海量TPU的使用，开发出了一种新的模型——Brainformer，其收敛速度比传统的Transformer模型快5倍，推理速度快2倍。这种模型使用了MoE模块和一些其他巧妙的技巧，充分发挥了TPU的强大性能...

2023-05-29 talkingdev

最近，研究人员提出了一种新的模型，称为接受加权键值（RWKV），它将Transformer的高效并行训练和RNN的高效操作结合起来。RWKV采用线性注意机制的独特方法，可以在不同阶段像Transformer或RNN一样使用，证明了与Tran...

2023-05-25 talkingdev

Meta AI提出了一种新的AI模型架构，名为Megabyte，可以在多个格式上生成超过100万个标记。Megabyte解决了当前模型中的可扩展性问题，并并行执行计算，提高了效率并优于Transformers。 ## 核心要点：以下是这篇新...

2023-05-24 talkingdev

### 内容摘要： - Transformer已经取代循环神经网络成为大多数文本处理任务的主要工具。 - 由于架构的限制，这些Transformer很昂贵且上下文受限。 - RWKV是一种具有注意力变体的模型，它声称结合了Transformer和循...