漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-01 talkingdev

OpenAI与Time达成协议,共享101年新闻资料库

Time最近与OpenAI签订了一项许可协议,允许OpenAI的人工智能在其101年的新闻资料库上进行训练,并获取实时内容以回答用户关于突发新闻的查询。作为回报,OpenAI将引用Time,并链接回其源材料。这项协议的签订,标志...

Read More
2024-07-01 talkingdev

MUMU视觉模型:强势引领图像和文本的交织生成

MUMU视觉模型是一种创新的生成图像模型,它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于,它不仅仅是将...

Read More
2024-07-01 talkingdev

Lambda Labs训练Open Sora视频模型,一键生成乐高电影

Lambda Labs最近在其1-click集群上训练了一个名为Open Sora的视频模型,用于制作乐高电影。这一技术的出现,不仅改变了乐高动画制作的传统方式,也为AI技术在创新应用中开辟了新的道路。利用这一模型,制作者可以方...

Read More
2024-06-30 talkingdev

LosslessCut:无损视频/音频编辑的瑞士军刀

LosslessCut是一款免费、开源的视频/音频编辑工具,可以快速剪辑、裁剪、分离、合并视频/音频文件,而且完全不会影响文件的原始质量。它非常适用于需要快速剪辑视频/音频的人,比如YouTuber、播客、视频爱好者等等。...

Read More
2024-06-28 talkingdev

Mamba 2快速实现方案开源

本文主要介绍了如何快速实现Mamba 2,而不需要关联扫描。Mamba 2是一种新型的技术实现,其主要优势在于无需进行繁琐的关联扫描,大大提高了工作效率。这种实现方式不仅节省了大量时间,而且降低了出错的可能性。在Gi...

Read More
2024-06-28 talkingdev

Gemma 2系列9B和27B模型现已开源

我们很高兴地宣布,Gemma 2系列的两款新型号——9B和27B现已正式上市。这两款新型号均秉承了Gemma 2系列的一贯优良传统,将先进的技术与优雅的设计完美融合。无论是在性能、可靠性还是易用性方面,Gemma 2的9B和27B都...

Read More
2024-06-28 talkingdev

FAL公开源代码超级分辨率图像扩大器GigaGAN

FAL最近公开了超级分辨率图像扩大器AuraSR的源代码。这款工具只需一次前向传递,就可以实现4倍的扩大,甚至在多次应用后仍能保持良好的效果。AuraSR在处理生成的图像上表现出色。FAL公司此次公开源代码,无疑为图像...

Read More
2024-06-28 talkingdev

Point-SAM:互动引导下的3D分割变革模型

为满足对详细3D数据的日益增长的需求,研究人员推出了Point-SAM,这是一种基于变革者的3D分割模型。这个模型将大大提高3D数据处理的效率和精度。与传统的3D分割技术相比,Point-SAM能够提供更精细的数据,从而更好地...

Read More
  1. Prev Page
  2. 27
  3. 28
  4. 29
  5. Next Page