速度提升的相关内容 - 漫话开发者

2024-05-15 talkingdev

如何让Postgres查询速度提升1千倍

Postgres是一个流行的关系型数据库，但在处理大型数据集时可能会变得缓慢。一项新的研究表明，通过使用特定的查询优化技术，可以将Postgres查询速度提高1千倍。研究人员发现，通过使用特定的索引和优化查询语句，可...

2024-05-01 talkingdev

QUICK是一套新的优化CUDA内核，通过解决内存问题，提升了大型语言模型的效率。这导致了NVIDIA GPU上的显著速度提升，使AI模型运行更快，效率更高。QUICK的出现，无疑为AI领域带来了新的可能性，通过优化内存处理方式...

2024-04-29 talkingdev

Llamafile是一种自包含的可执行文件，可以在任何平台上直接运行模型。它的最新更新带来了两倍的速度提升，以及在可移植性方面的显著改进。这意味着用户可以更快地运行和处理复杂的数据模型，无需担心不同平台之间的...

2024-04-12 talkingdev

持续集成测试（CI测试）是软件开发中的一项重要技术，它的历史可以追溯到20世纪80年代。本文将探讨CI测试的发展历程，以及未来可能的优化方向。CI测试的核心在于频繁地将代码集成到共享仓库中，以便及时发现并解决问...

2024-03-29 talkingdev

英国阿斯顿大学的研究团队通过利用光纤系统中尚未使用的波长带，成功实现了每秒301太比特的互联网数据传输速度。这一创纪录的速度是现有最快的光纤网络的450万倍，有望彻底改变未来互联网通信的面貌。此次技术的突破...

2024-03-29 talkingdev

英国阿斯顿大学的研究团队通过使用光纤系统中尚未利用的波长带，实现了每秒301太比特的互联网数据传输速度。这一突破性的成就，为未来高速互联网的实现提供了可能性。研究团队通过优化光纤传输技术，显著提高了数据...

2024-03-11 talkingdev

微软的强大DeepSpeed训练库更新了，可以让模型每个参数使用6位。这可以将推理速度提升超过2倍。

2024-03-04 talkingdev

如何加速推理是许多人关注的话题。本代码分享介绍了如何通过静态KV缓存提高Hugging Face框架上Llama模型的推理速度。