漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-09 talkingdev

微软开源Minference,大幅提升模型推理速度

微软近日发布了Minference,这是一款能够显著提升支持模型推理速度的系统。通过一系列系统性的改进,Minference能够在不损失准确性的前提下,大大提升模型的推理速度。这一创新举措显示了微软在人工智能领域的巨大投...

Read More
2024-07-09 talkingdev

Meta发布AI新突破:多token预测模型现已开放研究

Meta推出了利用全新的多令牌预测方法的预训练模型,该方法可以同时预测多个未来的词汇,承诺提升性能并大幅度缩短训练时间。这种新颖的多令牌预测方法改变了我们对于未来词汇的预测方式,将其从单一的词汇预测转变为...

Read More
2024-07-08 talkingdev

fun-audio:发布超强音频理解与生成模型

近日,Tongyi语音团队发布了他们的最新成果,一套超强的音频理解与生成模型。这套模型的发布,无疑将大大推动音频技术的发展与进步。模型的理解部分,能够准确分析出音频中的各种元素和信息,包括但不限于音质、音色...

Read More
2024-07-08 talkingdev

SDXL全新训练,搭载全套LLM嵌入器(Hugging Face Hub)

SDXL是一款出色且开放的扩散模型,其搭载了全套LLM嵌入器(Hugging Face Hub),能够展现出强大的文本理解能力。这款模型的训练过程是从零开始的,开发者们通过将LLM嵌入到模型中,来增强其对文本内容的理解和解析能...

Read More
2024-07-05 talkingdev

FlexiFilm-新扩散模型助力长视频生成

FlexiFilm 是一种专门为生成超过30秒的长视频而设计的扩散模型,它能够保证生成的视频具有高度的一致性和质量。这一新模型的出现,将在视频制作领域开启新的可能性。视频长度不再受限,而且模型生成的视频质量也得以...

Read More
2024-07-05 talkingdev

支持在浏览器WebGPU上运行的Florence 2模型

Florence 2是一个小型视觉模型,完全基于onnx和WebGPU在浏览器中运行。WebGPU是一种新型的Web标准,为Web应用程序提供高效的低级图形和计算功能。这种模型旨在帮助开发者更好地理解和利用WebGPU的性能优势。Onnx则是...

Read More
2024-07-05 talkingdev

提升智能手机摄像头清晰度的新方法开源

本项目介绍了一种使用自我监督学习模型提高智能手机上图像分辨率的方法,该模型能够改善基于参考的超分辨率(RefSR)。通过使用自我监督学习模型,我们能够有效地提升智能手机摄影的图像质量和分辨率,使得拍摄出来...

Read More
2024-07-05 talkingdev

SEMamba:一种基于Mamba状态空间模型的语音增强系统

SEMamba是一款全新的语音增强系统,它利用了Mamba状态空间模型来提高语音信号的清晰度。这款语音增强系统的主要目标是通过去噪和清晰的语音信号处理,来提高人们的语音识别和理解。SEMamba系统具有高度的灵活性,能...

Read More
  1. Prev Page
  2. 224
  3. 225
  4. 226
  5. Next Page