苹果公司近日发布了OpenELM,这是一套包含八种开源语言模型(LLM)的系列产品。这些模型可以高效地在单一设备上运行,用于文本生成任务,其参数大小范围从2.7亿到30亿。OpenELM的发布,标志着苹果在人工智能与机器学...
Read More加权CPS(WCPS)是符合预测系统的一个扩展,专门用于适应数据环境的变化,特别是协变量的转变。协变量在统计学中是一种可以影响到研究结果的外部变量,而WCPS通过自适应调整,能更好地应对这种变化。这种扩展方法在...
Read More在人工智能领域,神经网络是一种非常重要的模型。为了提高神经网络的性能,研究人员需要使用高效的工具来构建、编辑和可视化这些网络。近日,谷歌发布了名为Penzai的JAX研究工具包,旨在帮助研究人员更轻松地完成这...
Read More研究人员近日开发了一种名为Mixture of Prefix Prompt Experts(MPPE)的新技术,旨在增强零样本学习模型中的对话状态跟踪能力。该方法通过转移知识至未见领域,而无需新的数据集注释。这一新技术将有助于提升机器对...
Read More著名人工智能科学家Andrew Ng博士,现任AI基金的常务总经理合伙人,近日宣布加入亚马逊公司的董事会。Andrew Ng博士在人工智能和机器学习领域有着举足轻重的影响力,此前曾是谷歌大脑项目创始人之一,并在百度担任首...
Read More近期,科技界发起了一项名为BabyLM的挑战,旨在推动研究人员和开发者在极度有限的数据条件下,训练出性能卓越的文本和视觉模型。这一挑战的核心理念是模仿人类婴儿在成长初期所接触到的数据量,大约为1000万个token...
Read More近期,一个名为“离散扩散实现”的项目在GitHub上引起了广泛关注。该项目提供了一种简洁的离散扩散算法实现方式,包含了众多最新的技术组件。这种新型算法不仅训练速度快,而且稳定性强,能够很好地适应各种复杂的数据...
Read MoreDGMamba框架是一种创新的技术,它利用状态空间模型Mamba来解决领域泛化中的挑战。状态空间模型是一种先进的机器学习方法,通过将系统状态表示为一组变量,并预测其在时间上的演变,从而提高模型的泛化能力和对新场景...
Read More