漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-20 talkingdev

新技术助力模型持续学习:MoE适配器框架

研究人员开发了一种新框架,通过为新任务增加特殊适配器的方式来扩展模型,帮助视觉-语言模型在不遗忘之前知识的情况下进行持续学习。这一技术突破为深度学习模型的持续学习能力提供了新的解决方案,能够有效避免传...

Read More
2024-03-20 talkingdev

全新数据压缩技术:AI模型训练数据集大幅缩减

近日,一项名为Poster Dataset Distillation的技术引起了广泛关注。该技术能够将庞大的数据集压缩成一个单一的'海报',使得人工智能模型能够通过不到一张每个类别的图片进行学习。这一创新方法大幅减少了训练AI模型...

Read More
2024-03-20 talkingdev

苹果公司发布全新“MM1”人工智能模型细节

苹果公司近期公布了其新型人工智能模型“MM1”的详细信息。这一模型在训练大型语言模型方面采用了一种创新方法,能够无缝整合文本和视觉信息。这种整合方式有望提升AI模型在理解和处理复杂信息方面的能力,特别是在处...

Read More
2024-03-19 talkingdev

新兴AI资源网站More Useful Things揭示AI生成提示的奇特效能

近期上线的伴随网站More Useful Things为公众提供了大量免费的人工智能与机器学习资源。该网站通过一系列实验展示了AI生成的提示,例如富有想象力的场景构造,在解决数学问题等任务中如何超越人工编写的提示。这些实...

Read More
2024-03-19 talkingdev

人工智能提示工程的终结

最新的研究显示,随着人工智能和机器学习模型不断优化自身的提示,人类的提示工程师可能面临淘汰。由算法生成的提示虽然奇特,却异常有效,它们不仅胜过人工编写的提示,还大幅缩短了优化时间。尽管自动调整的提示显...

Read More
2024-03-19 talkingdev

论文:自注意力机制下的下一个标记预测技术揭秘

下一个标记预测作为一个简单的目标,却能引发复杂的行为模式。最新的研究发现,仅通过一个自注意力层并结合梯度下降法训练,就能将问题分解为困难的检索和柔和的组合,这一过程不仅实现了上下文学习,还显著提升了模...

Read More
2024-03-18 talkingdev

Cappy:小型评分器如何超越大型多任务语言模型

Cappy是一款小型模型,专门设计用于接收指令和候选完成,然后为完成度打分,以衡量其完成指令的程度。在这项任务上,Cappy的表现超越了许多更大的模型,这表明它可能作为训练和生成过程中的一个反馈机制。Cappy的成...

Read More
2024-03-18 talkingdev

OpenAI意外泄露下一代ChatGPT升级版GPT-4.5 Turbo?

近日,OpenAI疑似意外发布了一篇博客文章,该文章被Bing和DuckDuckGo索引后迅速被撤下。文章似乎是关于GPT-4.5 Turbo的公告,这是一个新的模型,其速度、准确性和可扩展性均超越了GPT-4 Turbo。缓存的描述中提到了20...

Read More
  1. Prev Page
  2. 29
  3. 30
  4. 31
  5. Next Page