大型语言模型的相关内容 - 漫话开发者

2024-02-20 talkingdev

GPTScript：新的自然语言模型编程体验

GPTScript是一种新的脚本语言，可以自动化与OpenAI大型语言模型的交互。该项目的最终目标是创建一个完全基于自然语言的编程体验。GPTScript使用了最新的自然语言处理技术，使得编程变得更加直观和容易上手。GPTScrip...

2024-02-20 talkingdev

研究人员创建了OpenMathInstruct-1，这是一个用于训练开源大型语言模型数学的新数据集，可与闭源模型的性能相匹配。这一突破包含180万个问题解决对，为更加可访问和有竞争力的数学教学AI工具打开了大门。

2024-02-19 talkingdev

最近，研究人员提出了一种新方法，称为SLEB，可以通过剪枝冗余的变压器块来加速大型语言模型（LLMs）的训练和推理。该方法可以减少存储空间和计算成本，同时保持模型的准确性。SLEB通过自适应的剪枝技术来删除冗余的...

2024-02-19 talkingdev

Meta使用大型语言模型为其代码库编写测试，发现测试覆盖率和整体代码质量都有了实质性的提高。这种方法可以有效地帮助开发人员减少手动编写测试的时间和成本，并且可以提高测试的效率和准确性。Meta表示，他们使用了...

2024-02-16 talkingdev

研究人员对是否可能判断数据点是否用于训练大型语言模型进行了全面研究。他们测试了各种模型，并发现，在大多数情况下，这些攻击并不比随机猜测更好。

2024-02-15 talkingdev

据外媒报道，OpenAI的CEO Sam Altman正在与投资者磋商，计划筹集高达7万亿美元用于AI芯片制造。该项目旨在解决GPU短缺问题，因为这些芯片对于训练和运行大型语言模型至关重要。潜在的投资者包括主权财富基金和政府实...

2024-02-15 talkingdev

GenTranslate是一种新的方法，它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

2024-02-15 talkingdev

随着大型语言模型与外部工具的配对越来越多，数据泄露的新风险已经出现。本文介绍了一种系统性的方法来评估这些人工智能系统保护私人信息的能力。研究人员发现，当前的大型语言模型在保护隐私方面存在一些问题。它...