深度学习的相关内容 - 漫话开发者

2024-02-06 talkingdev

论文：AI技术在音频质量评估中的应用

近日，研究人员开发出了一种名为PAM的工具，它使用音频语言模型对音频质量进行评估，无需参考曲目或专业培训。PAM通过深度学习算法，将音频数据转化为分布式表示形式，并将其与质量分数进行关联。据研究人员介绍，PA...

2024-01-31 talkingdev

近日，一款名为SliceGPT的新一代模型压缩工具问世。据悉，该工具可以适用于从Phi-2等小型模型到大型模型的多种规模，并可对模型的权重矩阵进行剪枝处理，最大程度保持模型质量的同时，实现模型参数的大幅度减少，以...

2024-01-26 talkingdev

TensorDict是一个非常实用的小工具，它可以让你在PyTorch中使用字典和张量。使用TensorDict可以提高代码的可读性和可用性，同时保持良好的性能。 TensorDict提供了一种简单的方法来将张量转换为字典，并且可以像字...

2024-01-25 talkingdev

SyncTalk是逼真的人物形象中的突破。它克服了以往在同步面部身份、唇部运动和表情方面遇到的挑战。SyncTalk使用最新的深度学习技术，通过从少量的样本中学习，以逼真的方式生成高质量的人物形象。 SyncTalk可以应用...

2024-01-25 talkingdev

本文简要介绍了硬件特定的矩阵乘法优化和一般流程，以加速AI代码。现代深度学习算法中，矩阵乘法是常见的操作。优化矩阵乘法的实现可以显著提高模型的训练和推理速度，进而提高模型的准确性和效率。矩阵乘法优化的主...

2024-01-24 talkingdev

Depth Anything是一种新的单目深度估计方法，它依赖于约6200万张图像的大规模数据集来提高其精度。通过使用数据增强和预训练编码器的辅助监督，该模型实现了令人印象深刻的泛化能力，并在深度估计方面树立了新的标准...

2024-01-24 talkingdev

LoRA是一种低秩适配器，可让您仅微调语言模型中的少量参数。它们可以显着改善和改变这些模型的性能。

2024-01-23 talkingdev

将文本描述转化为视频是当前研究的热门领域，最近几周出现了许多强大的模型。Hugging Face团队的这篇博客概述了这一任务、当前面临的挑战以及研究的现状。虽然不是完全全面的，但对于进一步阅读提供了良好的起点。