漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-03-22 talkingdev

论文:扩散状态空间模型引领图像生成新纪元

扩散状态空间模型(DiS)是一种新型的扩散模型,它采用状态空间骨干代替了传统的U-Net处理图像数据。这种模型在保持计算效率的同时,能够处理长距离依赖问题,并且能够生成高质量的图像。与传统的U-Net相比,DiS模型...

Read More
2024-03-20 talkingdev

Quiet-Star:提升语言模型输出准确性的推理框架开源

Quiet-Star是一个推理框架,旨在增强语言模型生成正确输出的能力。该框架的代码已经公开,同时发布了一个每个令牌8步的模型。Quiet-Star通过优化模型的推理过程,提高了生成文本的准确性和相关性,对于自然语言处理...

Read More
2024-03-19 talkingdev

音乐界的ChatGPT来了:Suno的AI模型根据文本提示创作音乐

Suno公司研发的AI模型能够根据文本提示创作出完整的音乐作品。这一创新技术在音乐产业中引起了广泛关注。不同于传统的音乐制作方式,Suno的AI模型不仅独立完成音乐创作,还巧妙地利用OpenAI的ChatGPT技术来生成歌词...

Read More
2024-03-18 talkingdev

MusicLang:用API和模型生成音乐的开源工具

MusicLang是一个新兴的API和模型集合,旨在为开发者和音乐爱好者提供生成音乐的功能。通过这一工具,用户可以轻松地创造出独特的旋律和和谐音乐。MusicLang的灵活性和易用性使其成为音乐创作和实验的理想选择,无论...

Read More
2024-02-19 talkingdev

论文:Meta利用LLM提高自动化单元测试

Meta使用大型语言模型为其代码库编写测试,发现测试覆盖率和整体代码质量都有了实质性的提高。这种方法可以有效地帮助开发人员减少手动编写测试的时间和成本,并且可以提高测试的效率和准确性。Meta表示,他们使用了...

Read More
2024-02-19 talkingdev

论文:如何使用扩散模型进行视频压缩

研究人员开发了一种新的视频压缩方法,使用扩散模型生成高质量的视频帧,同时保持低数据速率。该方法将视频压缩与机器学习相结合,能够在保持视频质量的同时减少数据传输的成本。研究人员在测试中发现,这种方法能够...

Read More
2024-02-15 talkingdev

GenTranslate:利用LLM进一步提高翻译准确性

GenTranslate是一种新的方法,它利用大型语言模型来提高翻译质量。它专注于基础模型生成的最佳翻译。该方法在测试中已被证明优于当前领先的翻译模型。

Read More
2024-02-13 talkingdev

SPIN-自我博弈的微调训练方法开源

自然语言处理(NLP)中,让语言模型生成自己的训练数据是一个具有挑战性但前景广阔的研究领域。SPIN是一种方法,已经显示出很大的前途。该代码已经发布,但据报道使用起来很有挑战性。

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page