漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-21 talkingdev

论文:模型之间的知识转移技术探讨

本文探讨了不同的数据优化方案,以实现在最小的计算成本下,模型之间的知识转移。此技术能够帮助开发人员在不同场景下利用已有的模型知识,从而节省时间和成本。研究人员发现,通过将数据集合并和调整模型参数,可以...

Read More
2023-11-09 talkingdev

基于Transformer扩散模型的训练成本比基于UNet的模型便宜90%

PixArt是一种新的文本到图像模型,它使用T5文本编码、交叉注意力和扩散变压器,以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型,可以比使用UNet模型训练快90%。PixArt模型的训练...

Read More
2023-11-02 talkingdev

微软通过重大突破推动小型AI模型的界限

微软研究院已在其较小的语言模型Phi 1.5上增强了多模态能力,使其能够像OpenAI更大的GPT-4模型一样解释图像,但计算成本更低。Phi 1.5模型结合了文本和视觉信息,可以推断出对应的文本或图像。该模型在多个数据集上...

Read More
2023-10-19 talkingdev

BitNet新设计开源:更高效的语言模型架构

研究人员开发出BitNet,这是一种新的大型语言模型设计,使用更少的能量和内存。BitNet使用一种新的技术来平衡模型的准确性和计算效率,同时减少了对大量数据的依赖。这一新设计的目的是为了降低大型语言模型的计算成...

Read More
2023-10-06 talkingdev

程序员应了解的云计算成本

本文列出了程序员应了解的云计算成本清单,并对成本进行了详细的分解。了解这些数字将有助于程序员为各种不同的项目进行快速成本估算。他们只需要了解项目的架构和规模,就可以计算出一个大致的成本,而不需要任何复...

Read More
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-08-24 talkingdev

OneDiffusion:使扩散模型部署更简单可扩展

在生产环境中部署扩散模型一直是一个挑战,因为这些模型难以处理,且计算成本高。但是现在,OneDiffusion的出现旨在使部署和微调变得更易于管理、可扩展且可靠。OneDiffusion是一个开源项目,它的目标是使扩散模型在...

Read More
2023-08-15 talkingdev

论文:轻量级RGB-D分割技术助力移动机器人理解环境

有效的RGB-D语义分割可以帮助移动机器人更好地理解他们所在的环境。尽管深度数据提供了有用的几何洞察,但它可能会带来噪声。本文介绍了一种精简的网络,该网络使用的计算功率较少,但仍然稳健,有效地融合了色彩和...

Read More
  1. Prev Page
  2. 9
  3. 10
  4. 11
  5. Next Page