漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-12 talkingdev

论文:更好理解和推理图片的新方法研究

本研究的作者们已经创建了一种方法,用以测试视觉语言模型对于他们所看到的内容进行逻辑思考的能力。视觉语言模型是一种结合了计算机视觉和自然语言处理的技术,它能理解和解释图片中的内容。然而,这种模型在理解和...

Read More
2023-09-12 talkingdev

RestGPT:基于LLM的自主控制Agent

RestGPT是一款旨在构建基于大型语言模型的自主控制实体的新型语言模型,其主要应用领域包括电影数据库和音乐播放器等实际应用。此模型采用先进的自然语言处理技术,将人类语言输入转化为计算机可以理解和执行的命令...

Read More
2023-09-08 talkingdev

单一宽前馈层:转变你的编码解码器

在变压器网络中,前馈层占据了大部分的总权重。然而,如果你使用一个单一的大型前馈层,共享给编码器和解码器,你可以显著提高推理时间,同时性能的下降微乎其微。这是一种有效的优化手段,可以有效提升网络的运行效...

Read More
2023-09-08 talkingdev

DiffBIR开源:强大的图像优化和恢复模型

最近,一款名为'生成图像恢复'的新技术在GitHub上发布。该技术利用扩散原理,降低模糊度,增强图像细节。它是一种强大的图像提升和恢复模型,可以有效地改进图像质量,使模糊的、低分辨率的图像变得更加清晰。该模型...

Read More
2023-09-08 talkingdev

Claude聊天机器人推出付费版本,费用为每月20美元

Anthropic公司近日推出了其Claude聊天机器人的付费版本,价格为每月20美元。此次付费版本的推出,标志着Claude聊天机器人的商业化步伐进一步加快。这也表明,Anthropic公司对于其AI产品的商业价值有着高度的认同和期...

Read More
2023-09-06 talkingdev

论文:强化零样本模型的微调技术

零样本模型是人工智能模型中的一种,他们在广泛的分布上都有着强大的性能。但是,如果你在特定的狭窄任务上对它们进行调整,它们可能会在提高特定任务性能的同时,失去原本的广泛适应性。这个现象虽然有其积极的一面...

Read More
2023-09-06 talkingdev

BLoRA开源,同一GPU上批量处理LoRAs

LoRAs是一种小型的参数适配器,通过插入到某些层次来改变底层模型的行为。你可以为基础模型进行批量生成,以提高性能。此外,你还可以对LoRA修改后的模型进行批量处理,并向不同的用户提供具有不同性能的模型。这种...

Read More
2023-09-05 talkingdev

Tiny Llama开源:1.1B参数模型训练

小型羊驼(Tiny Llama)项目旨在为3T代币训练出一个参数为11亿的羊驼2(Llama2)模型。根据扩展规律,这对于计算优化来说无疑是严重的过度训练,但它对于部署优化带来了显著的收益。此次的模型训练打破了传统的优化...

Read More
  1. Prev Page
  2. 47
  3. 48
  4. 49
  5. Next Page