斯坦福大学人类中心人工智能研究院(Stanford HAI)发布了最新版本的基础模型透明度指数,对包括OpenAI和Google在内的14家主要人工智能开发商的透明度进行了评估。这些公司披露了之前未向公众公开的新信息,标志着在...
Read MorexAI近期公开发布了Grok-1模型的权重和架构。Grok-1是一种混合专家模型,拥有3140亿参数。发布的模型是Grok-1预训练阶段的原始基础模型检查点,这意味着它并未针对任何特定应用进行精调。该模型是由xAI使用自定义训练...
Read More近日,EfficientTrain++推出了一种新颖的课程学习策略,显著减少了主要视觉模型如ResNet和Swin在ImageNet数据库上的训练时间。据悉,这种新的学习策略最多可以将模型训练时间缩短三倍。EfficientTrain++的这一突破不...
Read More近期,研究人员开发了一种新的时序基础模型,名为TimesFM。该模型可应用于各种时间序列预测问题,包括股票价格、气象数据和交通流量等。TimesFM的优点在于能够处理数据的多种特征,如周期性、趋势性和季节性等。此外...
Read MoreMeta AI最新推出的Segment Anything Model(简称SAM)是计算机视觉领域的一个重要的基础模型,该模型在图像分割方面表现出色,但在某些特定领域中却显得力不从心。为了解决这个问题,Meta AI推出了一项新的项目,即A...
Read MoreReka是一家专业训练大型基础模型的公司,尽管资金规模只是顶级玩家的一小部分,但其发展速度却迅速赶超了一些业界最佳参与者。近日,Reka发布了其内部评估套件Vibe-Eval的一个子集,该套件被用于确定其模型的强度。...
Read MoreMamba模型是一种先进的方法,擅长处理长序列,而不会带来传统Transformers的计算缺点。在计算机视觉领域,Mamba模型已经取得了显著的成果,并在多个应用中展现出其优越性。相比于传统的Transformers模型,Mamba模型...
Read MoreEleuther团队近期对T5模型进行了重新训练,采用了现代的分词器并延长了训练时间。T5作为现代AI领域的一匹黑马,此次升级后的Pile-T5模型在编码任务上表现出了显著的性能提升。经过持续的优化和调整,Pile-T5在多项基...
Read More