漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-07-08 talkingdev

SDXL全新训练,搭载全套LLM嵌入器(Hugging Face Hub)

SDXL是一款出色且开放的扩散模型,其搭载了全套LLM嵌入器(Hugging Face Hub),能够展现出强大的文本理解能力。这款模型的训练过程是从零开始的,开发者们通过将LLM嵌入到模型中,来增强其对文本内容的理解和解析能...

Read More
2024-07-05 talkingdev

FlexiFilm-新扩散模型助力长视频生成

FlexiFilm 是一种专门为生成超过30秒的长视频而设计的扩散模型,它能够保证生成的视频具有高度的一致性和质量。这一新模型的出现,将在视频制作领域开启新的可能性。视频长度不再受限,而且模型生成的视频质量也得以...

Read More
2024-07-05 talkingdev

支持在浏览器WebGPU上运行的Florence 2模型

Florence 2是一个小型视觉模型,完全基于onnx和WebGPU在浏览器中运行。WebGPU是一种新型的Web标准,为Web应用程序提供高效的低级图形和计算功能。这种模型旨在帮助开发者更好地理解和利用WebGPU的性能优势。Onnx则是...

Read More
2024-07-05 talkingdev

提升智能手机摄像头清晰度的新方法开源

本项目介绍了一种使用自我监督学习模型提高智能手机上图像分辨率的方法,该模型能够改善基于参考的超分辨率(RefSR)。通过使用自我监督学习模型,我们能够有效地提升智能手机摄影的图像质量和分辨率,使得拍摄出来...

Read More
2024-07-05 talkingdev

SEMamba:一种基于Mamba状态空间模型的语音增强系统

SEMamba是一款全新的语音增强系统,它利用了Mamba状态空间模型来提高语音信号的清晰度。这款语音增强系统的主要目标是通过去噪和清晰的语音信号处理,来提高人们的语音识别和理解。SEMamba系统具有高度的灵活性,能...

Read More
2024-07-05 talkingdev

PTQ4SAM:用后训练量化使SAM更实用

PTQ4SAM是一个新的框架,旨在减少大规模Segment Anything Model(SAM)的内存和计算需求。SAM是一个全新的大规模模型,但其大规模的特性也使得其在实际应用中面临着严峻的挑战,尤其是在内存和计算资源上的需求。而P...

Read More
2024-07-05 talkingdev

论文:CELLO-增强因果理解的全新数据集

CELLO是一种全新的数据集,包含了14,094个因果问题,旨在提升AI对因果关系理解的能力,超越了常识推理的层次。这个数据集的构建,旨在推动AI技术在处理更复杂问题时,具有更深沉的因果关系理解。由此,可以有效提升...

Read More
2024-07-05 talkingdev

论文:UIST新分词方法显著提升点击率预测

UIST是一种创新的方法,通过将密集嵌入转换为用户和项目表示的紧凑、离散的令牌,显著地改善了点击率预测。不同于传统的持续嵌入方法,UIST将嵌入空间离散化,使得模型能够捕捉到更加细粒度的特征。此外,这种离散化...

Read More
  1. Prev Page
  2. 11
  3. 12
  4. 13
  5. Next Page