漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-15 talkingdev

论文:探索LLMs的安全性

最近的一项研究中,研究人员利用名为'Evil Geniuses'的虚拟团队测试了LLMs的安全性。他们发现这些人工智能代理对恶意攻击的鲁棒性较差,提供更复杂的回复,使不当回复更难以检测。

Read More
2024-03-07 talkingdev

从零开始培训LLMs的初创公司

一家名为LLMify的初创公司正在推出一种新的方法来训练语言模型,他们将在没有预训练模型的情况下从零开始培训LLMs。该公司的创始人表示,这种方法可以提高模型的准确性和适用性,并加快训练时间。该公司已经引起了一...

Read More
2024-03-06 talkingdev

论文:支持更长上下文长度的LLMs技术研究

近日,研究人员开发了一种名为Resonance RoPE的新技术,帮助LLMs更好地理解和生成比其原始训练序列更长的文本。这种方法在现有的Rotary Position Embedding(RoPE)系统上进行了改进,提高了模型在长文本上的性能,...

Read More
2024-03-01 talkingdev

LLMs使用Dual Chunk Attention处理10万个令牌

Dual Chunk Attention(DCA)扩展了大型语言模型(如Llama2 70B)的能力,使它们能够处理超过100k个令牌而无需额外的训练。它将注意力计算分解成块,增强了模型对短期和长期上下文的理解。

Read More
2024-02-29 talkingdev

Databricks、Anyscale和微软的十大AI见解

本文报道了对AI领域前沿公司的创始人的采访,涵盖了他们对AGI到来的看法,如何思考LLMs以及创始人在产品中如何处理AI的简单策略。

Read More
2024-02-28 talkingdev

VSP-LLM可视化语音识别框架开源

Visual Speech Recognition with Language Models(VSP-LLM)框架在视觉语音识别和翻译中引入了新的方法,通过集成LLMs来高效处理视频输入,通过去重嵌入视觉特征和使用低秩适配器进行成本效益训练。

Read More
2024-02-28 talkingdev

ConceptMath:一种全新的测试LLMs数学技能的方法

ConceptMath是一种新的双语基准,用于测试LLMs在英语和中文的数学技能。它的独特之处在于它将数学问题分解为特定的概念,从而允许更详细地评估AI在数学上的优势和劣势。 这项技术将有助于开发更准确的AI模型,以应对...

Read More
2024-02-27 talkingdev

使用LLMs进行注释的论文精选

这是一份关于使用LLMs进行注释的精选论文列表,LLMs是一种基于机器学习的语言模型,能够自动预测文本中的下一个单词或字符。使用LLMs进行注释可以提高注释的准确性和效率,目前在自然语言处理和计算机视觉领域被广泛...

Read More
  1. Prev Page
  2. 6
  3. 7
  4. 8
  5. Next Page