漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-06-21 talkingdev

需要去重大量数据吗?

AI模型的训练数据质量对于获得良好性能非常重要。在代码模型中,数据去重往往非常重要。对于文本而言,目前尚不清楚它是否同样重要。然而,无论如何,本博客介绍了用于去重文本样式数据的技术。

Read More
2023-06-15 talkingdev

开源代码模型击败ChatGPT在编码任务中(GitHub Repo)

近日,一种开源代码模型在编码任务中表现超越ChatGPT等语言模型。封闭模型之所以强大,是因为它们实际上是伪装成语言模型的代码模型。很多开放式语言模型表现不佳,因为它们无法从大规模的代码预训练中获得推理能力...

Read More
2023-05-05 talkingdev

HuggingFace在Replit上开放Pass@20代码模型

近期,mosaic ML平台引起了广泛关注。其中一个令人惊讶的模型就是Pass@20,该模型的大小惊人地小,但性能卓越。它由曾经在Google编程合成项目工作的人员在转到Replit后进行训练。在标准的HumanEval基准测试中,它可...

Read More
2023-04-17 talkingdev

亚马逊AWS推出Bedrock基础设施服务

亚马逊宣布推出AWS的新服务Bedrock,该服务允许您使用来自各个公司(如Anthropic和Stability AI)的基础模型。这个想法是采用开放模型并将您的数据指向s3。最近,围绕数据隐私和安全性进行了很多讨论,通过这项服务...

Read More
2023-04-14 talkingdev

亚马逊推出AWS Bedrock服务,支持使用不同公司的基础模型

亚马逊宣布推出AWS Bedrock服务,该服务允许用户使用来自不同公司的基础模型,如Anthropic和Stability AI。用户只需将数据指向Amazon S3,即可使用开放模型。随着数据隐私和安全性的讨论越来越多,使用AWS基础设施在...

Read More
  1. Prev Page