漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-05-13 talkingdev

音频扩散AudioDiff:ElevenLabs科学家新作开源

在科技日新月异的今天,ElevenLabs的一位研究科学家发布了一个名为音频扩散PyTorch的GitHub仓库,该仓库可能成为复制令人惊叹的结果的起点。这个仓库是基于PyTorch的音频扩散实验,旨在通过开源的方式,让更多的音频...

Read More
2024-05-13 talkingdev

Text2Any开源模型:Lumina引领全新一代技术革新

Lumina是一个新一代的项目,其目标是成为统一的文本到X生成模型。这个项目的训练涉及到图像、视频、音频和文本的交替,这种方法提高了下游性能。Lumina项目带来的这种全新技术,将对未来的人工智能、机器学习和深度...

Read More
2024-05-13 talkingdev

E2URec开源,让推荐系统“遗忘”用户数据保护隐私

E2URec是一种全新的方法,可以让基于大型语言模型的推荐系统高效、有效地“遗忘”用户数据,保证用户隐私的同时,又不牺牲系统性能。这种新方法以用户隐私保护为核心,通过改变推荐系统的学习机制,实现对用户数据的有...

Read More
2024-05-13 talkingdev

AnythingLLM-全新一体化LLM与RAG服务框架

近日,知名开源平台GitHub Repo发布了全新的服务框架——AnythingLLM。该框架具有LLM(Low Level Management)和RAG(Risk Analysis and Governance)两大主要功能,提供了一站式的服务体验。AnythingLLM的目标是通过...

Read More
2024-05-13 talkingdev

Salesforce发布BLIP-V3模型,主要用于图像理解和标注

近日,Salesforce已经训练并发布了广受欢迎的BLIP模型的第三个非商业版本。这款模型主要用于图像理解和标注,是视觉和语言模型的最新成果。Salesforce一直致力于开发和研究这种模型,以提高其在图像理解和标注方面的...

Read More
2024-05-13 talkingdev

Altera筹集900万美元,开发用于数字人的AI

Altera正致力于创建数字化人类,首先从可以与你一起玩任何游戏的代理人开始。这家公司在一轮超额认购的种子轮中筹集了900万美元,由First Spark Ventures(Eric Schmidt的深度科技基金)和Patron(由Riot Games的成...

Read More
2024-05-10 talkingdev

Mistral AI的估值飙升至60亿美元

总部位于巴黎的Mistral AI正在以60亿美元的估值进行募资,这一估值是其去年12月的三倍。作为一家领先的人工智能公司,Mistral AI的估值增长迅猛,充分反映了投资者对其技术和市场前景的高度认可。这次融资活动也进一...

Read More
2024-05-10 talkingdev

解读Vision Mamba:跨领域视觉任务应用及影响

本次我们将对Mamba项目进行全面的深度研究,探索其在各种视觉任务中的应用以及其不断发展的影响。Mamba项目是一个创新性的视觉技术项目,其在各个视觉任务领域中的应用逐渐被行业内人士和研究者所认可。我们将持续关...

Read More
  1. Prev Page
  2. 245
  3. 246
  4. 247
  5. Next Page