技术的相关内容 - 漫话开发者

2024-07-01 talkingdev

面向生成式AI的投资时代

尽管目前处在一种资金“狂热”的状态，但生成型AI市场已经开始出现了一些弱点。这种新型的AI技术正在迅速发展，吸引了大量的投资者关注。然而，由于市场竞争激烈，许多初创公司面临着巨大的挑战。尽管如此，投资者们依...

2024-07-01 talkingdev

DEX-TTS是一种全新的富有表现力的文本转语音（TTS）模型，它采用参考语音来改善风格表示和模型泛化。这种新型技术的出现，为语音技术领域开创了新的可能性。DEX-TTS模型通过参考语音，能够更准确地捕捉到语音风格的...

2024-07-01 talkingdev

纽约大学（NYU）最近推出了一种全面公开、性能卓越的视觉模型Cambrian-1。此模型对文本编码器和数据混合进行了大规模的消融研究。这一技术的开发，将对视觉模型的研发产生深远影响，推动相关技术向前发展。全面开放...

2024-07-01 talkingdev

Suri是一个由20,000份长篇文本和复杂指令配对的数据集。这个数据集的设计目的是为了提高AI的写作约束执行能力。开发Suri的团队引入了指令性ORPO（I-ORPO），这是一种利用合成破坏指令进行反馈的对齐方法。通过这个方...

2024-07-01 talkingdev

Time最近与OpenAI签订了一项许可协议，允许OpenAI的人工智能在其101年的新闻资料库上进行训练，并获取实时内容以回答用户关于突发新闻的查询。作为回报，OpenAI将引用Time，并链接回其源材料。这项协议的签订，标志...

2024-07-01 talkingdev

MUMU视觉模型是一种创新的生成图像模型，它的特点在于能够将文本和图像交织在一起进行更强的条件化处理。这种独特的方法使得MUMU视觉模型在性能上超越了纯文本条件化模型。MUMU视觉模型的核心优势在于，它不仅仅是将...

2024-07-01 talkingdev

Lambda Labs最近在其1-click集群上训练了一个名为Open Sora的视频模型，用于制作乐高电影。这一技术的出现，不仅改变了乐高动画制作的传统方式，也为AI技术在创新应用中开辟了新的道路。利用这一模型，制作者可以方...

2024-06-30 talkingdev

LosslessCut是一款免费、开源的视频/音频编辑工具，可以快速剪辑、裁剪、分离、合并视频/音频文件，而且完全不会影响文件的原始质量。它非常适用于需要快速剪辑视频/音频的人，比如YouTuber、播客、视频爱好者等等。...