OpenAI宣布了一项雄心勃勃的新研究目标:构建一个完全基于智能体的自动化AI研究员。据公司首席科学家雅各布·帕乔基透露,这一目标将成为未来几年的“北极星”方向。该AI研究员旨在独立处理大规模、复杂的科研问题,标...
Read More近日,一个名为Tinybox的离线AI设备项目在技术社区引发了广泛关注。该项目旨在打造一款能够本地离线运行高达1200亿参数大型语言模型的紧凑型硬件设备。这一构想直击当前AI应用的核心痛点:数据隐私、网络依赖和高昂...
Read More近日,GitHub上开源了一个名为MoDA的项目,它实现了一种创新的注意力机制——混合深度注意力。该机制的核心突破在于,允许注意力头同时访问当前层以及更早层的键值对。这一设计旨在解决随着模型深度增加,信息在传递过...
Read More法国人工智能公司Mistral AI正式推出了名为“Forge”的全新平台,旨在为企业和政府机构提供构建定制化AI模型的解决方案。该平台的核心特点是允许客户完全基于自身的专有数据,从头开始训练前沿级别的AI模型,而非仅仅...
Read More在深度学习领域,残差连接(Residual Connections)是构建深层神经网络的关键技术,它通过将浅层特征直接传递到深层,有效缓解了梯度消失问题。然而,传统的残差连接通常采用固定、均匀的累加方式,这可能限制了模型...
Read More人工智能研究机构Percepta近期发布了一项前沿研究成果,探讨了大型语言模型(LLMs)作为通用计算设备的可能性。该研究成功在Transformer架构内部构建了一个“计算机”,能够高效执行任意的C语言程序,并运行数百万个计...
Read MoreGitHub上开源项目Understudy展示了一种新型可教学AI桌面代理的前沿理念。该项目旨在开发一个能够像人类同事一样操作计算机的智能体,其核心创新在于通过演示进行学习,而非依赖传统的脚本录制或API集成。Understudy...
Read More谷歌近日正式推出了其新一代多模态嵌入模型Gemini Embedding 2,标志着人工智能在跨模态语义理解领域迈出了关键一步。该模型通过Gemini API和Vertex AI平台提供服务,其核心突破在于首次将文本、图像、视频、音频及...
Read More