漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-12-16 talkingdev

Veo 2视频生成模型:开创视频内容创作的新时代

Veo 2作为最新的视频生成模型,代表了视频内容创作的重大突破。该模型利用先进的机器学习技术,能够根据文本描述生成相应的视频内容,大大提升视频制作的效率和灵活性。Veo 2的核心优势在于其高度的自定义性和创造性...

Read More
2024-12-10 talkingdev

在消费级硬件上实现近即时AI图像生成模型

随着人工智能技术的快速发展,一个全新的AI模型被开发出来,旨在实现在普通消费级硬件上快速生成图像。这项技术利用深度学习算法和神经网络,使得图像创建过程几乎无需等待时间,大大提升了图像生成的效率。以往的图...

Read More
2024-12-09 talkingdev

Trellis:开创性的3D网格生成模型

Trellis是最新研发的3D网格生成模型,这一技术突破为3D建模领域带来了革命性的变化。Trellis通过深度学习技术,能够自动生成复杂而精细的3D网格模型,极大地提升了3D模型设计和制造的效率。该模型不仅能够理解几何结...

Read More
2024-07-11 talkingdev

Paints UNDO:模拟绘画过程,UNDO生成模型开源

来自ControlNet、IC-Light等图像生成系统的创建者,发布了名为Paints UNDO的系统,它是一个模型创建笔触以重建图像的系统。与以往的笔触系统不同,该模型可以撤消笔触,并且在进行过程中经常完全重新思考其方法,这...

Read More
2024-07-10 talkingdev

OccSora:驾驶场景中的4D占用生成技术

OccSora是一种基于扩散的4D占用生成模型,旨在改善长期的时间演变。这种模型是一种新颖的方法,可以生成时间和空间的占用,并且具有超前思考的能力。OccSora的引入将使驾驶场景的预测变得更为准确和实时,从而提高驾...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
2024-07-02 talkingdev

向Jupyter笔记本中添加Mistral Codestral和GPT-4o

Mistral Codestral和GPT-4o最近被添加到了Jupyter Notebooks中。Mistral Codestral是一种新型的代码编辑器,它可以提高代码的编写速度和质量,而GPT-4o是一种新型的文本生成模型,可以生成更加精准和自然的文本。这...

Read More
2024-06-26 talkingdev

AI与Morph Labs联手优化信息检索增强型生成模型

近日,AI与Morph Labs联合发布了一篇关于信息检索增强型生成(RAG)模型微调的优秀博客文章。在文章中,他们展示了一些合成数据的使用情况。信息检索增强型生成模型是一种新型的深度学习模型,它结合了信息检索技术...

Read More
2024-06-26 talkingdev

EvalAlign:一种文本到图像生成模型评估指标

EvalAlign是一种新型的用于改进文本到图像生成模型评估的指标。与现有的评估指标不同,EvalAlign提供了细粒度的准确性和稳定性。它主要关注图像的真实性和文本与图像的对齐性。与其他评估指标不同的是,EvalAlign不...

Read More
2024-06-11 talkingdev

苹果WWDC 2024:操作系统全面升级及AI特性重大更新

苹果在全球开发者大会(WWDC)的主题演讲中宣布了一系列AI特性和其操作系统的重大更新。其中,Apple的AI系统Apple Intelligence将为iPhone、iPad和Mac带来强大的生成模型,作为核心功能。这将使Apple的原生应用程序...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page