漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-11-13 talkingdev

VimGPT:使用 GPT-4V 和 Vimium 浏览互联网

由于互联网上的信息量越来越多,很多人都会疲于应对。现在,一种叫做 VimGPT 的新工具正在 GitHub 上流行。这个工具使用了 GPT-4V 和 Vimium,可以让用户更加快速、高效地浏览互联网。GPT-4V 是最新的 GPT 系列模型...

Read More
2023-11-13 talkingdev

LM4Visual-基于AI文本模型来进行视觉任务

研究人员发现,尽管大型语言模型是为文本设计的,但它们可以成为处理视觉任务的强大工具。使用文本训练的模型的部分来直接处理图像和视频,研究人员在各种视觉任务中取得了改进的结果。该研究结果表明,基于文本的AI...

Read More
2023-11-13 talkingdev

LongQLoRA:提升LLMs上下文理解能力

GitHub上有一个新的工具——LongQLoRA,它可以让LLMs(语言模型)理解更长的序列。LLMs已经在自然语言处理方面取得了很大的成功,但它们的上下文理解能力有限。长序列的理解也是LLMs的一个挑战。LongQLoRA通过对序列切...

Read More
2023-11-13 talkingdev

Adept实验室推出企业智能代理系统

Adept实验室正在为企业建立一个有用的代理系统。现在它正在推出小型演示,供人们与之互动,如委派知识工作任务、使用新工具或处理非结构化数据。 Adept的代理系统能够根据用户需求,执行特定的任务并提供相关的反馈...

Read More
2023-11-10 talkingdev

Punica:运行多个LoRA精细调整模型的利器

Punica是一个开源的Python库,旨在降低使用LoRA精细调整模型的成本。LoRA是一种用于低功耗、远距离通信的无线电调制技术。在使用LoRA进行通信时,需要对模型进行精细调整以获得最佳性能。Punica可以同时运行多个精细...

Read More
2023-11-10 talkingdev

Roboflow发布GPTV示例,辅助计算机视觉应用开发

Roboflow是一个计算机视觉工具包,通过可组合的代码片段使应用程序开发更加容易。现在,随着GPT-4 Vision进入OpenAI API,Roboflow团队已经制作了一些演示,展示如何与segment anything和DINO一起使用它。

Read More
2023-11-10 talkingdev

日语图像字幕评估迈向新的视野

研究人员开发了JaSPICE,一种用于评估日语图像字幕的度量标准,填补了除英语以外的其他语言工具如SPICE不存在的空白。SPICE是一种用于衡量图像字幕生成的度量标准,但是对于日语等其他语言而言,缺乏相应的工具。JaS...

Read More
2023-11-09 talkingdev

自动生成体育比赛解说工具

这个notebook使用了OpenAI的多项新技术,以令人信服的方式解说体育比赛。它可以自动识别比赛中的场景,例如球员的位置和行动,球的位置和轨迹,比赛的得分等等。此外,它还可以根据比赛的进展和结果,实时生成解说的...

Read More
  1. Prev Page
  2. 66
  3. 67
  4. 68
  5. Next Page