模型开发的相关内容 - 漫话开发者

2024-03-26 talkingdev

AI应用开发中Go、Python与Rust的语言角色分析

本文深入探讨了Python、Go和Rust三种编程语言在人工智能应用开发中的作用与地位。Python以其广泛的AI库支持而成为AI模型开发的主力语言；Go语言因其高效的并发处理能力，适合用于规模化生产环境；而Rust则因其内存安...

2024-03-22 talkingdev

Sakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术，旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布，并附带了方法的解释。这一创新技术将有助于降低AI模型开...

2024-01-16 talkingdev

Anthropic发布了一项非常有趣的研究，该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现，它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说，一旦模型被污染，就无法使用当前的工具消除不良...

2023-10-19 talkingdev

斯坦福人工智能与人类中心研究所（Stanford HAI）最新发布的“基础模型透明度指数”显示，主要的AI基础模型开发者在社会影响方面提供的信息不足。虽然Meta的Llama 2在透明度方面得分最高，为54%，其次是BloomZ和OpenAI...

2023-10-11 talkingdev

美国警告欧盟，其提出的人工智能（AI）规定可能偏向于资源充足的公司，而对小型公司造成伤害。华盛顿的分析批评了欧盟对AI模型开发的关注，而非模型使用的风险，这可能会威胁到在欧盟的投资和AI研发。关于如何在AI问...

2023-09-06 talkingdev

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始，基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现，将为人工智能模型开发带来革新。通过大规模的参数训练，该模型已经在人类评估（HumanEval...

2023-08-18 talkingdev

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具，可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程，通过使用 DeepEval，开发者可以在不连接网络的情况下，对其进行评估和优化...

2023-06-07 talkingdev

## 新闻概要： - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容：...