漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-08-07 talkingdev

LISA推出推理分割技术 - LLMS

图像分割是一种将图像中属于对象的每个区域进行标记的过程,这比传统的分类问题要复杂得多。而且,如果没有预定义的对象列表,进行通用分割将是一项挑战。包含某些世界表示的语言模型可以为分割提供巨大的推动力。LI...

Read More
2023-08-04 talkingdev

论文:提升大型语言模型的错误识别能力

最新研究探索了大型语言模型如何能够识别自身的错误,特别是在多步骤推理问题中,无需依赖外部资源。研究人员开发了一种零射击验证方法来识别错误并提高问题回答任务的性能。大型语言模型对于多步骤推理问题的处理,...

Read More
2023-08-04 talkingdev

论文:SoftMoE,一种改进的稀疏混合专家模型,低成本提高模型容量

SoftMoE 是一种新的模型架构,它改进了稀疏的混合专家(MoE)模型。通过使用软分配方法,每个专家处理输入令牌的子集,SoftMoE以更低的成本提供了更大的模型容量。在视觉识别任务中,SoftMoE的表现超过了标准的变压...

Read More
2023-08-03 talkingdev

LISA开源:通过LLM进行推理分割

这项研究引入了一个名为“理性分割”的新AI任务,设计用于根据复杂和隐含的文本指令生成分割掩膜。此研究展示了一个名为LISA(Large-language Instructed Segmentation Assistant)的工具作为展示。LISA结合了大语言模...

Read More
2023-07-24 talkingdev

纯C语言实现的Llama 2训练与推理库开源

Andrej Karpathy 编写了一个受到llama.cpp极大启发的酷炫库,可以用于纯C语言训练和推理新的Llama 2模型。这个库对于那些对底层编程感兴趣的人来说是一个很好的资源(就像他的所有代码一样)。GPT4在编写过程中给予...

Read More
2023-07-18 talkingdev

语言模型在道德推理方面的表现不佳

近期,一些硅谷的大思考家们辩称,人工智能并不会构成重大风险,因为他们认为道德推理的能力会随着技术能力的提高而提高。然而,一篇最新的论文对这一观点提出了具体的反驳,该论文显示,现代语言模型在进行道德推理...

Read More
2023-07-12 talkingdev

bitsandbytes发布4位推理,实现AI模型精度与速度的突破

AI模型包含许多参数,它们在计算机中以十进制数字的形式表示。这些数字的精度决定了它们的准确度和占用的空间大小。如果将精度从32位降低到16位,将会大幅提高运行速度。现在,我们可以将精度降低到4位,从而在一些...

Read More
2023-07-12 talkingdev

Anthropic发布新模型Claude 2:提供更强大的性能和扩展响应

Anthropic公司最近发布了其最新模型Claude 2。Claude 2提供了改进的性能,扩展的响应,并可通过API和beta站点进行访问。Claude 2拥有增强的推理,编码和数学能力,可以处理每个提示中多达100K的令牌,使其能够处理复...

Read More
  1. Prev Page
  2. 21
  3. 22
  4. 23
  5. Next Page