漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-23 talkingdev

HuggingFace发布视觉/语言模型IDEFICS:复制并优化Flamingo模型

人工智能公司HuggingFace近日发布了IDEFICS,这个名字是一个复杂的缩写,全称为Image-aware Decoder Enhanced à la Flamingo with Interleaved Cross-attentionS。IDEFICS实质上是Flamingo模型的复制版本,Flamingo...

Read More
2023-08-18 talkingdev

WizardLM,利用强化进化指令教大型语言模型进行推理

近期,WizardLM团队的研究进展备受关注。他们最新的论文探讨了用于指令调整的数据策划问题。WizardLM在强化学习部分做出了突破性的提升,成功超越了许多封闭源模型在数学和推理任务上的表现。他们的研究成果可能会对...

Read More
2023-08-17 talkingdev

SPP开源,利用LLMs增强问题解决能力

近日,一项研究引入了一种名为Solo Performance Prompting(SPP)的方法。该方法利用LLMs中的多个角色模拟认知协同,这是一种提高问题解决能力的协作过程。通过使用经过精细调整的角色,SPP使LLMs能够处理需要深度领...

Read More
2023-08-14 talkingdev

机器学习模型是记忆还是泛化?揭秘模型训练动态

本文探讨了一个微型模型的训练动态,并反向工程了它找到的解决方案。这为我们揭示了一个令人兴奋的新兴领域——机械可解释性。机器学习模型在工作时,是通过记忆数据还是通过泛化理解进行推理?这是一个长期存在且至关...

Read More
2023-08-14 talkingdev

WizardLM团队推出全球最优秀的开源数学模型

近日,WizardLM团队公布了全球最佳的开源数学模型。这个模型在处理多步骤问题的推理能力上表现出色,同时,模型还具有一定的“幻想”能力,这在数学领域表现得十分有趣,并且可以提供解释。如果你对学习数学感兴趣,那...

Read More
2023-08-10 talkingdev

提升计算机视觉学生网络的方法开源

深度神经网络在计算机视觉领域有着出色的表现,但是更快的推理时间是必要的。这篇论文介绍了一种新的Inter-Class Similarity Distillation方法和一种Adaptive Loss Weighting策略,能够更好地从老师网络向学生网络传...

Read More
2023-08-09 talkingdev

英伟达发布新的人工智能芯片,声称运行LLMs的成本将“显著降低”

英伟达宣布推出GH200,一款专为运行人工智能模型设计的新芯片。它与H100使用相同的GPU,但搭配了141GB内存和一个72核的ARM中央处理器。额外的内存将允许更大的人工智能模型在单个系统上运行,并显著降低推理成本。GH...

Read More
2023-08-07 talkingdev

人工智能与推理结构:探讨其潜在局限性

虽然生成式人工智能(AI)的表现令人赞叹,但由于在推理类型上的根本概念限制,其智能水平尚未达到人类的水平。这不仅对当前的AI技术具有重要意义,同时也对于创造真正的人工通用智能(AGI)起到了决定性的作用。生...

Read More
  1. Prev Page
  2. 20
  3. 21
  4. 22
  5. Next Page