研究人员正在探究数据增强技术对提高大型语言模型(LLMs)数学推理能力的影响。他们通过增强现有数据集中的查询,创建了一个新的数据集AugGSM8K,并开发了一个名为MuggleMath的模型。数据增强技术能有效提升模型的数...
Read More研究人员推出了一种名为FAVOR的新方法,该方法通过在帧级别精细融合音频和视觉细节,使大型语言模型能够理解视频。FAVOR方法的推出,为大型语言模型的视频理解能力提供了新的发展空间。这种新方法通过在帧级别精细融...
Read MoreUnity的总裁兼首席执行官John Riccitiello在此职位上服务了九年。他的领导才能和坚定的决心将Unity推向了新的高度。然而,他现已宣布立即辞职,这一消息在业界引起了广泛的关注。目前尚不清楚谁将接任他的位置,也不...
Read MoreNixOS是一款基于Nix包管理器构建的Linux发行版,擅长在多台机器上复制一致的系统环境。Flakes是一项实验性功能,它记录所有外部依赖项并锁定其版本,这一功能极大地提高了Nix包管理器和NixOS配置的可复制性和可组合...
Read More谷歌的DeepMind与33个研究所联手,共同开发了名为Open X-Embodiment的数据库,这个数据库相当于计算机视觉中的ImageNet数据库。这个数据库包含来自22种机器人类型的500多个技能和150,000个任务,旨在通过提供共享资...
Read More机械可解释性是通过将神经网络分解为更可解释的子部分来理解神经网络的过程。不幸的是,神经元本身往往不可解释。有一些深层次的原因,如叠加,导致了这个挑战。Anthropic公司的这项工作使用稀疏自编码器从一层Trans...
Read More据悉,Google即将推出名为Gemini的新型人工智能模型,有望超越现有的GPT-4模型。随着AI技术不断获得视觉和语音能力,其应用范围也在不断扩大,同时也引发了人们对其潜在问题的关注。人工智能的未来取决于人类如何负...
Read MoreClaude最近推出了一项新技术,该技术将其记忆库的容量提高到了100,000个令牌。此次技术升级主要通过两种技术实现了对技术文档的索引能力的提升。Anthropic公司也对此进行了全面的发布,并推出了名为'Anthropic Cookb...
Read More