机器学习的相关内容 - 漫话开发者

2024-03-20 talkingdev

新技术助力模型持续学习：MoE适配器框架

研究人员开发了一种新框架，通过为新任务增加特殊适配器的方式来扩展模型，帮助视觉-语言模型在不遗忘之前知识的情况下进行持续学习。这一技术突破为深度学习模型的持续学习能力提供了新的解决方案，能够有效避免传...

2024-03-20 talkingdev

近日，一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报'，使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

2024-03-20 talkingdev

苹果公司近期公布了其新型人工智能模型“MM1”的详细信息。这一模型在训练大型语言模型方面采用了一种创新方法，能够无缝整合文本和视觉信息。这种整合方式有望提升AI模型在理解和处理复杂信息方面的能力，特别是在处...

2024-03-19 talkingdev

近期上线的伴随网站More Useful Things为公众提供了大量免费的人工智能与机器学习资源。该网站通过一系列实验展示了AI生成的提示，例如富有想象力的场景构造，在解决数学问题等任务中如何超越人工编写的提示。这些实...

2024-03-19 talkingdev

最新的研究显示，随着人工智能和机器学习模型不断优化自身的提示，人类的提示工程师可能面临淘汰。由算法生成的提示虽然奇特，却异常有效，它们不仅胜过人工编写的提示，还大幅缩短了优化时间。尽管自动调整的提示显...

2024-03-19 talkingdev

下一个标记预测作为一个简单的目标，却能引发复杂的行为模式。最新的研究发现，仅通过一个自注意力层并结合梯度下降法训练，就能将问题分解为困难的检索和柔和的组合，这一过程不仅实现了上下文学习，还显著提升了模...

2024-03-18 talkingdev

Cappy是一款小型模型，专门设计用于接收指令和候选完成，然后为完成度打分，以衡量其完成指令的程度。在这项任务上，Cappy的表现超越了许多更大的模型，这表明它可能作为训练和生成过程中的一个反馈机制。Cappy的成...

2024-03-18 talkingdev

近日，OpenAI疑似意外发布了一篇博客文章，该文章被Bing和DuckDuckGo索引后迅速被撤下。文章似乎是关于GPT-4.5 Turbo的公告，这是一个新的模型，其速度、准确性和可扩展性均超越了GPT-4 Turbo。缓存的描述中提到了20...