计算成本的相关内容 - 漫话开发者

2024-02-19 talkingdev

论文：SLEB-剪枝冗余变压器块，加速大型语言模型

最近，研究人员提出了一种新方法，称为SLEB，可以通过剪枝冗余的变压器块来加速大型语言模型（LLMs）的训练和推理。该方法可以减少存储空间和计算成本，同时保持模型的准确性。SLEB通过自适应的剪枝技术来删除冗余的...

2024-02-06 talkingdev

PAP-REC提出了一种自动创建个性化提示的推荐语言模型的方法，增强了它们的效率和效果。该方法基于用户的历史行为和偏好，并且能够自动识别关键字和短语，以生成更准确的推荐。同时，该方法能够在不增加额外计算成本...

2024-01-29 talkingdev

研究人员开发出一种名为共享特征校准（SFC）的方法，以增强语义分割。这个方法通过在特征图上进行跨层归一化，来缩小不同层次特征图之间的差异，从而提高了模型的性能。通过在多个数据集上的测试，研究人员发现，使...

2024-01-22 talkingdev

生成式图像模型最受欢迎的用途之一是个性化风格的图像生成。历史上，这需要训练LoRA或使用DreamBooth。现在，通过使用ID嵌入，您可以在仅使用单张图像的情况下大大提高质量并降低计算成本。

2024-01-01 talkingdev

苹果公司近日发布了两篇论文，介绍了新的三维头像和高效语言模型推断技术。这些技术的引入或将允许人工智能系统在iPhone和iPad上运行，极大提高智能设备的性能和用户体验。苹果的新技术为三维头像的生成提供了更为高...

2023-11-30 talkingdev

科学家们开发出一种新方法，使用生成扩散技术创建代理数据集，这种数据集具有更好的代表性和更多样化，同时需要的计算资源更少。这种方法可以通过在代理数据集中训练神经网络来提高模型的性能。这种方法可以降低计算...

2023-11-21 talkingdev

本文探讨了不同的数据优化方案，以实现在最小的计算成本下，模型之间的知识转移。此技术能够帮助开发人员在不同场景下利用已有的模型知识，从而节省时间和成本。研究人员发现，通过将数据集合并和调整模型参数，可以...

2023-11-09 talkingdev

PixArt是一种新的文本到图像模型，它使用T5文本编码、交叉注意力和扩散变压器，以比可比模型低得多的计算成本取得了出色的结果。这种新模型使用Transformer扩散模型，可以比使用UNet模型训练快90%。PixArt模型的训练...