该项目引入了AgentBench,一个用于测试大型语言模型(LLMs)在各种交互环境中的基准工具。在对25个LLMs进行的初步测试中,结果显示商业模型的表现超过了开源模型。这项研究为我们理解和评估大型语言模型的交互性能提供...
Read More研究人员已经开发出一种新的方法,叫做双聚合变换器(DAT),该方法通过空间和通道注意力来提升图像的超分辨率效果。DAT使用了诸如自适应交互模块和空间门前馈网络等特殊工具,其性能优于当前的其他方法。空间和通道...
Read MoreTorchScale是一款PyTorch库,让研究者和开发者能够更高效、更有效地扩展Transformers。它是为了满足对于大规模数据处理的需求而生的工具,通过使用TorchScale,我们可以在保持高性能的同时,实现Transformers的扩展...
Read More各大公司正大力投资AI专用数据中心,以应对AI应用日益增长的需求。据预测,到2029年,AI基础设施市场将增长至4225.5亿美元。值得注意的是,数据中心初创公司CoreWeave已成功获得23亿美元的融资,用于扩展其AI专用数...
Read More近期,研究社区一直在努力将单张照片生成为3D资源,但对于稍具细微差别的物体,这一过程通常会出现失败,并且其效果总体来说并不理想。然而,一个名为Magic123的全新方法似乎实现了突破。Magic123采用2D和3D先验知识...
Read More近段时间来,大家在讨论的焦点主要集中在计算瓶颈问题上。这通常意味着创业者们将深入研究找出解决方案。一家新公司正在试图制造专门的Transformer芯片。我们希望这种芯片不仅可以用于推断,还能应用于训练。虽然这...
Read More最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...
Read More如Auto-GPT和Baby AGI等代理化语言模型的发展,可能会快速推动人工智能的发展。这些模拟人类认知功能的语言模型,为对齐和可解释性提出了新的挑战,但由于它们以英语处理信息,所以提供了独特的可解释性。
Read More