技术的相关内容 - 漫话开发者

2024-02-16 talkingdev

Facebook发布开源音频生成模型MaGNET

近日，Facebook发布了一款最先进的开源音频模型MaGNET，该模型速度是其他替代品的7倍，而且不会影响音频质量。MaGNET模型可以生成音乐和音效。MaGNET模型的论文已经发布，更多详情请访问GitHub仓库。

2024-02-16 talkingdev

Google最近推出了一种新的文本到视频模型Lumiere，该模型可以将图像和风格作为输入，并使用一种新颖的“空时UNet”同时扩散所有内容。该模型采用了深度学习技术，可以将文本内容转换为相对应的视频，并且不需要任何人...

2024-02-16 talkingdev

谷歌推出了Gemini 1.5，开发者和企业用户可以提前体验，而消费者版的全面推出还需要等待。新版Gemini的性能高端，与谷歌最近推出的高端Gemini Ultra相媲美。Gemini 1.5采用了专家混合技术，使得模型对于用户而言更快...

2024-02-15 talkingdev

Galileo AI推出的设计生成工具，名为Galileo AI(Product)，可以在极短的时间内产生高质量的界面设计。该工具使用人工智能技术，能够分析用户需求并根据需求快速生成设计。Galileo AI(Product)已经在多个设计团队中得...

2024-02-15 talkingdev

据外媒报道，OpenAI的CEO Sam Altman正在与投资者磋商，计划筹集高达7万亿美元用于AI芯片制造。该项目旨在解决GPU短缺问题，因为这些芯片对于训练和运行大型语言模型至关重要。潜在的投资者包括主权财富基金和政府实...

2024-02-15 talkingdev

在接受《时代》杂志的采访中，Meta的AI首席科学家Yann LeCun谈到了人工通用智能（AGI）、开源和AI风险等话题。LeCun表示，AI的发展是一个长期过程，要实现AGI需要克服许多技术和理论上的限制，但是这是一个值得追求...

2024-02-15 talkingdev

GenTranslate是一种新的方法，它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

2024-02-15 talkingdev

研究人员引入了一种新的图像分割技术，只使用基本图像标签即可识别图像特定部分，例如狗。他们通过引入一种新的方法来解决网络识别同一对象的多个实例的挑战，并优化了该过程，降低了错误率。