漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-01 talkingdev

深入探讨:训练MoEs模型

Mosaic团队已与PyTorch合作,撰写关于如何扩展他们的MoEs模型至数千个GPU的文章。MoEs,全称Mixture of Experts,是一种深度学习的模型结构,其核心思想是将复杂的问题分解为若干个相对简单的子问题,然后由专家系统...

Read More
2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日,一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器(Trajectory Diffusion Transformer)和多视图...

Read More
2024-06-27 talkingdev

论文:DeepMind通过联合样本选择进行数据策划,进一步加速多模态学习

在预训练中,如何积极选择下一批最好的样本是一个挑战性和开放性的问题。DeepMind的这项工作探索了如何只花费10%的浮点运算和硬挖掘负样本,仍然能匹配各种任务的最新技术。在这个过程中,他们采用了一种名为“联合样...

Read More
2024-06-25 talkingdev

Toucan-基于全球7000种语言的文本转语音TTS模型开放

近期,Toucan发布了一套新的文本转语音模型,这套模型已经扩展,可以支持所有ISO-639-3标准语言。这个开创性的举措,将使全球各地的用户都能享受到语言转换的便利。无论是在学习、工作,还是日常生活中,这都是一项...

Read More
2024-06-25 talkingdev

OpenAI继续扩展,收购Multi桌面应用技术

近期,OpenAI继续其收购狂潮,此次他们收购了一项名为Multi的基础桌面应用技术。此举旨在为OpenAI的未来发展提供更坚实的技术基础,使得他们在人工智能领域的研究和应用能有更大的突破。OpenAI一直以来都致力于在人...

Read More
2024-06-24 talkingdev

论文:QMIX方法对多Agent模型中的更优探索

科研人员已经通过在最大熵框架内增加一种本地Q值学习方法,改进了用于多代理强化学习的流行方法QMIX。这种新的改进方法可以使多代理模型在进行任务处理时,更加精确和高效。本地Q值学习方法的引入,使得每个代理都能...

Read More
2024-06-06 talkingdev

GenS:从多视图图像中重建3D表面模型开源

GenS是一款端到端的通用神经表面重建模型,能够在没有3D监督的情况下,从多视图图像中出色地重建表面。与传统的表面重建方法相比,GenS在处理复杂的几何形状和纹理细节方面表现尤为突出。这一模型不仅提高了重建的精...

Read More
2024-06-03 talkingdev

AI技术向边缘计算迈进,开辟全新应用领域

随着人工智能(AI)技术的不断进步,AI正在向多模态和边缘计算方向发展。这种转变不仅改变了我们对AI的使用方式,还大大提高了其在实际应用中的有效性。多模态AI是指能够处理多种形式的数据,例如文本、图像和语音,...

Read More
  1. Prev Page
  2. 2
  3. 3
  4. 4
  5. Next Page