漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-04-03 talkingdev

Light Whisper:为苹果芯片打造极速Whisper语音识别实现

Lightning Whisper MLX是一款针对苹果硅芯片优化的Whisper语音识别算法的高速实现版本。它采用批量解码技术以提高吞吐量,运用蒸馏模型以加快解码速度,并引入量化模型以加速内存传输。相较于传统的Whisper CPP,Lig...

Read More
2024-02-06 talkingdev

Pygmalion推理引擎开源

Aphrodite引擎可以用于减少VRAM需求,提高AI推理工作负载的吞吐量。Pygmalion推理引擎是一种全新的AI推理引擎,它可以在减少VRAM需求的同时提高吞吐量。该引擎基于Aphrodite引擎并进行了优化,可以在保持准确性的同...

Read More
2023-09-20 talkingdev

RabbitMQ与Kafka - 架构师的抉择(第一部分)

RabbitMQ和Kafka是两个流行的消息代理平台,被广泛应用于大规模分布式系统中。然而,架构师在选择哪个平台来满足他们的需求时,常常会感到困惑。本系列文章将探讨RabbitMQ和Kafka的优缺点,帮助架构师做出明智的选择...

Read More
2023-06-22 talkingdev

高吞吐量和内存高效的Transformer(GitHub Repo)

随着Transformer的不断流行,使用频率远远超过训练。这可能会非常慢和昂贵,但通过在GPU上进行一些巧妙的内存布局优化,它们可以获得多倍的加速。

Read More