深度学习模型的相关内容 - 漫话开发者

2024-03-26 talkingdev

Cerebras推出新型CS3芯片，支持24T参数语言模型训练

Cerebras公司近日推出了其最新款的CS3晶圆芯片，该芯片具备训练高达24T参数语言模型的能力。CS3芯片的发布，标志着在人工智能领域对高性能计算芯片的需求得到了进一步的满足。这款芯片原生支持PyTorch，使得开发者能...

2024-03-26 talkingdev

PSALM是大型多模态模型（LMM）的扩展版本，通过引入一个掩码解码器和多功能输入模式，在各种图像分割任务中表现出色。这种方法不仅克服了仅限于文本输出的限制，而且还使模型能够有效理解和分类复杂图像。PSALM的创...

2024-03-20 talkingdev

研究人员开发了一种新框架，通过为新任务增加特殊适配器的方式来扩展模型，帮助视觉-语言模型在不遗忘之前知识的情况下进行持续学习。这一技术突破为深度学习模型的持续学习能力提供了新的解决方案，能够有效避免传...

2024-03-19 talkingdev

最近，GitHub上出现了一个名为LLM4Decompile的项目，该项目利用大型语言模型来尝试还原二进制代码。这种方法的出现，可能对程序员在调试和理解已有软件方面带来革命性的变化。传统的反编译方法通常只能将机器码转换...

2024-03-06 talkingdev

SURE技术是一种将多种技术结合起来，提高深度神经网络对于图像分类任务中不确定性预测可靠性的新方法。该方法通过模型置信度估计、模型不确定性估计和置信度校准三个步骤来实现置信度的提高。SURE技术的应用将大大提...

2024-03-04 talkingdev

Modular推出了一款名为MAX的工具包，可大大简化和加速AI部署。现在可用。MAX提供了一个简单易用的接口，可以在几分钟内为任何深度学习模型构建和部署一个API。它还为开发人员提供了一个可扩展的插件系统，以便更轻松...

2024-01-31 talkingdev

近日，一款名为SliceGPT的新一代模型压缩工具问世。据悉，该工具可以适用于从Phi-2等小型模型到大型模型的多种规模，并可对模型的权重矩阵进行剪枝处理，最大程度保持模型质量的同时，实现模型参数的大幅度减少，以...

2024-01-20 talkingdev

近日，一款名为Instance Segmentation for Novel Objects的GitHub开源项目备受关注。该项目旨在评估深度学习模型在实例分割方面对新物体的泛化能力。通过该项目，用户可以训练自己的实例分割模型，并对模型进行评估...