漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-10-24 talkingdev

量化Llama模型:速度提升与内存占用减少的完美结合

量化Llama模型在计算效率和内存管理方面取得了显著进展。通过优化算法和模型架构,最新版本的Llama模型在保持性能的同时,速度得到了显著提升。这种量化技术使得模型在处理大规模数据时更加高效,特别是在资源受限的...

Read More
2024-09-25 talkingdev

Orion:首款真正的增强现实眼镜正式亮相

Orion是我们推出的首款真正的增强现实眼镜,旨在提升用户的视野体验。这款眼镜采用先进的光学技术,能够将虚拟信息无缝叠加到现实世界中,为用户提供沉浸式的互动体验。Orion配备了高分辨率显示屏和强大的处理器,支...

Read More
2024-07-05 talkingdev

PTQ4SAM:用后训练量化使SAM更实用

PTQ4SAM是一个新的框架,旨在减少大规模Segment Anything Model(SAM)的内存和计算需求。SAM是一个全新的大规模模型,但其大规模的特性也使得其在实际应用中面临着严峻的挑战,尤其是在内存和计算资源上的需求。而P...

Read More
2024-06-29 talkingdev

Python量化金融工具包发布

近日,一款基于Python的量化金融工具包正式发布。该工具包提供一系列用于金融数据分析、建模和交易的工具和算法,包括股票和期货的回测、策略优化、风险管理等功能。该工具包支持多种数据源和交易平台,并提供了丰富...

Read More
2024-05-31 talkingdev

1bit-LLMs:AI能效问题的创新解决方案

随着大型语言模型性能的提升,其对能源和计算能力的渴求也随之增加。为降低成本,提高处理速度,同时减少对环境的影响,模型需要实现更小型化。研究人员目前采用一种名为量化的技术,通过减少模型参数的精度来压缩网...

Read More
2024-05-09 talkingdev

QoQ高效量化算法助力LLM推理加速

QoQ,一种新型量化算法,通过使用4位权重、8位激活和4位KV缓存,加速了大型语言模型推理。量化是一种广泛应用于深度学习中的技术,它能够减少模型的存储需求和计算复杂性。在这种情况下,QoQ算法采用了较低精度的数...

Read More
2024-05-01 talkingdev

Meta发布ExecuTorch框架,为边缘设备上的LLM提供支持

Meta发布了一款名为ExecuTorch的框架,这是一个后训练量化工具包,能够支持在各种iPhone和Galaxy设备上运行Llama模型。该框架能够在运行7B大小语言模型的手机上,每秒获取多达11个令牌。ExecuTorch框架的发布,进一...

Read More
2024-04-30 talkingdev

Mistral.rs:一款快速的LLM开源推理平台

近日,一款名为Mistral.rs的LLM推理平台在GitHub上备受关注。它可以支持多种设备上的推理,支持量化,并且具有易于使用的应用程序,带有OpenAI API兼容的HTTP服务器和Python绑定。无论是在深度学习推理、设备兼容性...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page