漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-12 talkingdev

论文:PaliGemma技术报告-基于SigLIP 和 Gemma 2B的强大视觉语言模型

PaliGemma是一款基于SigLIP和Gemma 2B的强大视觉语言模型。这份技术报告详细阐述了在构建PaliGemma过程中的架构选择和数据收集方面所做的决策。SigLIP和Gemma 2B的结合使得PaliGemma在视觉语言建模方面展现出卓越性...

Read More
2024-07-12 talkingdev

FlashAttention 3:现代快速语言模型的基础升级

FlashAttention是现代快速语言模型的基础,而最新的FlashAttention 3版本则是其重要的升级。与以前的版本相比,新版本使用了75%的H100容量(相比之前的35%有了显著的提升)。这次的能力提升归因于一系列重要的系统改...

Read More
2024-07-11 talkingdev

Korvus:基于Postgres的单查询RAG

Korvus是一种基于Postgres的新型工具,它可以实现单查询RAG技术。这种技术可以提高数据库的查询效率和准确性,特别是在处理大规模数据时。Korvus的开发者表示,它可以让用户以更直观的方式了解数据库中不同表之间的...

Read More
2024-07-11 talkingdev

FlashAttention-3: 异步和低精度实现快速准确的注意力机制

近日,由香港中文大学、清华大学等机构的研究人员提出了一种新的注意力机制模型——FlashAttention-3。相较于传统的注意力机制,FlashAttention-3 实现了异步和低精度计算,从而实现了在保证准确度的同时,大幅提高了...

Read More
2024-07-11 talkingdev

使用eBPF捕获Linux SSL/TLS明文,无需CA证书

最近,一组安全研究人员发现了一种新方法,可以使用eBPF在Linux系统上捕获SSL/TLS通信的明文数据,无需CA证书。SSL/TLS通常使用证书来验证通信的安全性,但是这种新方法可以在不需要证书的情况下获取通信的明文数据...

Read More
2024-07-11 talkingdev

WebVM:无服务器的客户端虚拟Linux环境

WebVM技术是一种无服务器的客户端虚拟Linux环境,可以在浏览器中直接运行,无需安装和配置,实现了轻松访问和使用Linux命令行工具的便利。具体来说,WebVM通过使用WebAssembly技术,将Linux操作系统打包成浏览器可执...

Read More
2024-07-11 talkingdev

Pieces Copilot+:真实时间AI助手产品发布

Pieces Copilot+是一款全新的产品,它可以帮助用户实时记忆任何事情。该产品具有现场AI助手功能,可以在设备上实时运行。无论是在工作中还是在生活中,Pieces Copilot+都可以成为用户的得力助手,帮助用户随时随地记...

Read More
2024-07-11 talkingdev

HF Transformers模型初始化速度提升30倍

现在,你可以通过在模型的首次运行中将一些懒加载移动到模型上,以极小的每秒令牌损失来显著提升模型初始化的速度。这种改进将大大提升模型运行效率,为用户带来更流畅的体验。

Read More
  1. Prev Page
  2. 36
  3. 37
  4. 38
  5. Next Page