漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-12-06 talkingdev

论文:线性时间序列建模

该论文借鉴了LSTM的思想,并训练了一个拥有3B参数的模型,其性能优于更大的7B参数Transformer模型。这项工作有望在序列建模领域取得新的进展,尤其是在性能和可伸缩性方面。

Read More
2023-12-05 talkingdev

StyleGAN-嵌入式个性化图像生成技术

一种新的方法利用扩展的StyleGAN嵌入空间W+用于文本到图像扩散模型,提高了生成图像中的身份保留能力。这种技术可以为个性化的图像生成提供更多的可能性,更好地满足用户的需求。

Read More
2023-11-23 talkingdev

Workflowy-快速自托管的开源工作流引擎

近日,一款名为Workflowy的快速自托管的开源工作流引擎发布了。该引擎旨在简化企业内部流程,并提高组织效率。Workflowy使用最新的云技术,可与许多不同的工具和技术集成。此外,Workflowy还具有灵活性和可扩展性,...

Read More
2023-11-20 talkingdev

生产级LLM工具开发者指南

使用语言模型构建工具是一种新兴的工程学科,涵盖了高性能计算、GPU编排和监控。在这个领域,LLMs(语言模型)是至关重要的组件,它们可以帮助工程师们开发出更智能、更高效的工具。本文将介绍如何在生产环境中使用L...

Read More
2023-11-20 talkingdev

一份帮助了解学生行为的数据集

研究人员扩展了SCB-ST-Dataset4,该数据集记录了诸如举手、阅读和书写等活动,以更好地通过深度学习来了解和检测学生的课堂行为。这个数据集是通过在课堂上安装传感器来捕捉学生行为的。研究人员使用了不同的深度学...

Read More
2023-11-13 talkingdev

VimGPT:使用 GPT-4V 和 Vimium 浏览互联网

由于互联网上的信息量越来越多,很多人都会疲于应对。现在,一种叫做 VimGPT 的新工具正在 GitHub 上流行。这个工具使用了 GPT-4V 和 Vimium,可以让用户更加快速、高效地浏览互联网。GPT-4V 是最新的 GPT 系列模型...

Read More
2023-11-13 talkingdev

LM4Visual-基于AI文本模型来进行视觉任务

研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
  1. Prev Page
  2. 24
  3. 25
  4. 26
  5. Next Page