漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-20 talkingdev

PIPS2开源,实时追踪数百个点的最新技术

PIPS2是一种最新的点追踪系统,能够进行密集的像素级追踪,并且能抵抗基础遮挡和快速运动。这种技术通过实现密集的像素级追踪,提供了一种更为精细和准确的方式来追踪和分析运动。此外,PIPS2的设计使其能够在遭受基...

Read More
2023-09-18 talkingdev

SyncDreamer开源,多视图合成技术进一步提升

近期,3D生成领域取得了飞速发展,其中,一个稳定且具有广泛应用前景的项目在GitHub Repo上获得了大量关注。这项工作被认为是最稳定且通用的。用户只需要输入一张图像,模型就能合成多个视图并生成相应的3D模型。这...

Read More
2023-09-15 talkingdev

构建基于RAG的LLM应用程序的全面指南

最近发布的GitHub仓库为开发者提供了一份详尽的指南,指导如何构建基于RAG(Retrieval Augmented Generation)的LLM(Language Learning Machine)应用程序。该指南详细介绍了从设计到实施的全过程,包括选择合适的...

Read More
2023-09-15 talkingdev

使JPEG与深度学习的优化相得益彰

JPEG图像无处不在,但由于在训练过程中无法轻松调整,所以它们与深度学习的兼容性并不好。这个项目回顾了现有的解决方案,并提出了一种新的方法,可以解决这些问题,使JPEG图像完全可调整且与深度学习系统兼容。JPEG...

Read More
2023-09-14 talkingdev

ExLlamaV2:在消费级GPU上运行本地LLMs的推理库

ExLlamaV2是一个在GitHub上开源的项目,它是为现代消费级图像处理单元(GPU)上运行本地语言模型(LLMs)而设计的推理库。这款推理库的出现,可以帮助用户在个人电脑上使用现代GPU进行深度学习模型的推理计算,而无...

Read More
2023-09-13 talkingdev

WhisperTurbo:OpenAI Whisper API的替代品

近日,GitHub在其官方库中发布了一款全新的技术产品——Whisper Turbo。该产品被设计为OpenAI Whisper API的替代品,主要用于提供语音转录服务。最引人注目的是,Whisper Turbo的转录速度是OpenAI Whisper API的20倍。...

Read More
2023-09-12 talkingdev

PointLLM开源,教会语言模型理解3D形状

近日,GitHub发布了名为PointLLM的新工具,该工具的主要功能是帮助语言模型理解3D对象,而非仅限于文本和2D图像。这一工具的出现,标志着语言模型在处理和理解更为复杂的三维信息方面迈出了重要一步,这将极大地推动...

Read More
2023-09-11 talkingdev

在浏览器中运行现代深度学习模型——Web AI

随着技术的成熟,WebAssembly的热度逐渐降低。现在,WebAssembly已经足够好,可以在很多生产场景中使用,包括基于浏览器的模型部署。Web AI是一个GitHub仓库,它允许在浏览器中运行现代深度学习模型,这标志着WebAss...

Read More
  1. Prev Page
  2. 56
  3. 57
  4. 58
  5. Next Page