漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-19 talkingdev

论文:SLEB-剪枝冗余变压器块,加速大型语言模型

最近,研究人员提出了一种新方法,称为SLEB,可以通过剪枝冗余的变压器块来加速大型语言模型(LLMs)的训练和推理。该方法可以减少存储空间和计算成本,同时保持模型的准确性。SLEB通过自适应的剪枝技术来删除冗余的...

Read More
2024-02-19 talkingdev

论文:Meta利用LLM提高自动化单元测试

Meta使用大型语言模型为其代码库编写测试,发现测试覆盖率和整体代码质量都有了实质性的提高。这种方法可以有效地帮助开发人员减少手动编写测试的时间和成本,并且可以提高测试的效率和准确性。Meta表示,他们使用了...

Read More
2024-02-16 talkingdev

研究人员发布关于LLM隐私的综合报告

研究人员对是否可能判断数据点是否用于训练大型语言模型进行了全面研究。他们测试了各种模型,并发现,在大多数情况下,这些攻击并不比随机猜测更好。

Read More
2024-02-15 talkingdev

OpenAI CEO Sam Altman欲从UAE等地筹集数万亿美元用于AI芯片制造

据外媒报道,OpenAI的CEO Sam Altman正在与投资者磋商,计划筹集高达7万亿美元用于AI芯片制造。该项目旨在解决GPU短缺问题,因为这些芯片对于训练和运行大型语言模型至关重要。潜在的投资者包括主权财富基金和政府实...

Read More
2024-02-15 talkingdev

GenTranslate:利用LLM进一步提高翻译准确性

GenTranslate是一种新的方法,它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

Read More
2024-02-15 talkingdev

论文:大语言模型的隐私保护能力

随着大型语言模型与外部工具的配对越来越多,数据泄露的新风险已经出现。本文介绍了一种系统性的方法来评估这些人工智能系统保护私人信息的能力。 研究人员发现,当前的大型语言模型在保护隐私方面存在一些问题。它...

Read More
2024-02-14 talkingdev

苹果发布多模态LLM指导下的图像编辑代码

苹果发布了一款新的代码,使用多模态语言模型来改进人类提供的自然语言图像编辑。这个新的代码的核心思想是使用大型语言模型来指导用户对图像进行编辑,从而提高编辑的质量和效率。该代码的具体实现是将图像与自然语...

Read More
2024-02-14 talkingdev

SGLang:针对LLM设计的结构生成语言

SGLang是一种针对大型语言模型设计的结构生成语言。它的设计目标是使与语言模型的交互更快速、更可控。SGLang提供了一种基于结构的生成方法,使用户能够更好地控制生成的文本。此外,它还提供了一些实用工具,如生成...

Read More
  1. Prev Page
  2. 16
  3. 17
  4. 18
  5. Next Page