漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-17 talkingdev

Rga:扩展Ripgrep,支持PDF、电子书和Office文档搜索

Rga是一款基于Ripgrep的全新搜索工具,旨在提升用户在多种文件格式中的搜索体验。除了传统的文本文件,Rga还支持在PDF、电子书、Office文档以及压缩文件(如zip)中进行搜索。这一功能的增加,使得用户在处理各种文...

Read More
2024-03-28 talkingdev

42.parquet——大数据分析的潜在威胁

Apache Parquet作为表格数据交换的事实标准,采用二进制、列式、压缩的数据表示方式,具备充足的元数据,使得文件无需额外信息即可正确解释。该格式得到大多数现代数据工具与服务的支持。然而,Parquet文件存在一定...

Read More
2024-01-02 talkingdev

几种压缩技术的探索

本文讨论了几种使文件更小的方法。压缩文件是现代计算机中非常常见的操作之一。在本文中,我们将探讨几种压缩文件的方法,包括使用zip、gzip、bzip2等文件格式,以及使用专为特定类型文件设计的压缩程序。此外,我们...

Read More
2023-11-28 talkingdev

ZipLoRA: 低秩学习矩阵合并技术提升模型性能

本文介绍了一种名为 ZipLoRA 的技术,该技术可以将多个低秩学习矩阵(LoRAs)合并在一起,从而改善模型性能。相比于常规的微调,LoRAs 更加经济实惠,但是也会改变模型的行为。本文提出的 ZipLoRA 技术可以在保留每...

Read More
2023-10-19 talkingdev

论文:Zipformer一种新的语音识别Transformer模型

这项研究介绍了Zipformer,一种用于自动语音识别(ASR)的改进Transformer模型,它更快、占用更少内存,而且比广泛使用的Conformer效果更好。Zipformer是一种新型的语音识别模型,它使用了一种全新的架构,能够更快...

Read More