漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-26 talkingdev

AI应用开发中Go、Python与Rust的语言角色分析

本文深入探讨了Python、Go和Rust三种编程语言在人工智能应用开发中的作用与地位。Python以其广泛的AI库支持而成为AI模型开发的主力语言;Go语言因其高效的并发处理能力,适合用于规模化生产环境;而Rust则因其内存安...

Read More
2024-03-22 talkingdev

日本顶尖AI实验室推出首个模型

Sakana AI开发了先进的日语语言、视觉和图像生成模型。该公司引入了一种进化模型融合技术,旨在无需昂贵的预训练即可发展基础模型。该模型融合技术已经发布,并附带了方法的解释。这一创新技术将有助于降低AI模型开...

Read More
2024-01-16 talkingdev

Sleeper Agents:如何训练具有持久性的LLMs

Anthropic发布了一项非常有趣的研究,该研究有意将语言模型中的“睡眠短语”进行有害污染。研究发现,它无法将这种模型与用于生产模型的强大系统进行“对齐”。也就是说,一旦模型被污染,就无法使用当前的工具消除不良...

Read More
2023-10-19 talkingdev

全球最大的AI模型透明度有限,Stanford HAI发布透明度指数报告

斯坦福人工智能与人类中心研究所(Stanford HAI)最新发布的“基础模型透明度指数”显示,主要的AI基础模型开发者在社会影响方面提供的信息不足。虽然Meta的Llama 2在透明度方面得分最高,为54%,其次是BloomZ和OpenAI...

Read More
2023-10-11 talkingdev

美国警告:欧盟的AI政策可能只利于大型科技公司

美国警告欧盟,其提出的人工智能(AI)规定可能偏向于资源充足的公司,而对小型公司造成伤害。华盛顿的分析批评了欧盟对AI模型开发的关注,而非模型使用的风险,这可能会威胁到在欧盟的投资和AI研发。关于如何在AI问...

Read More
2023-09-06 talkingdev

16亿参数模型在人类评估中取得32%的成绩

这是一个全新的、闪电般快速的代码生成模型。该模型是从零开始,基于1.2万亿个半代码半语言数据进行训练的。这一模型的出现,将为人工智能模型开发带来革新。通过大规模的参数训练,该模型已经在人类评估(HumanEval...

Read More
2023-08-18 talkingdev

DeepEval:为您的LLM流水线提供离线评估

DeepEval 是一个提供 Pythonic 方式进行离线评估的工具,可以帮助您方便地将 LLM 流水线投入生产。LLM 流水线是一种机器学习模型开发流程,通过使用 DeepEval,开发者可以在不连接网络的情况下,对其进行评估和优化...

Read More
2023-06-07 talkingdev

RedPajama 7B模型完成训练

## 新闻概要: - RedPajama数据集与部分训练模型已于几周前发布。 - 7B模型在3000台V100上刚刚完成训练。 - 经过调整的版本是其规模中最有效的开放模型之一。 - 团队有很多关于持续模型开发的计划。 ## 新闻内容:...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page