漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-01-01 talkingdev

苹果发布最新AI研究成果:或将彻底改变iPhone

苹果公司近日发布了两篇论文,介绍了新的三维头像和高效语言模型推断技术。这些技术的引入或将允许人工智能系统在iPhone和iPad上运行,极大提高智能设备的性能和用户体验。苹果的新技术为三维头像的生成提供了更为高...

Read More
2023-10-20 talkingdev

DALLE-3研究论文: 合成语句生成器、改进的建模以及提升的测量方法

DALLE-3研究论文揭示了其惊人性能的主要成分,包括合成标题生成器、改进的潜在扩散建模以及提升的忠实度、风格和连贯性测量方法。DALLE-3是一种生成式模型,具有非常出色的生成图像的能力,其原理是通过大量的图像和...

Read More
2023-10-18 talkingdev

微软关联研究发现GPT-4存在缺陷

微软附属的研究论文发现,尽管GPT-4总体上比GPT-3.5更可靠,但可以通过特定的“越狱”提示更容易地操纵其产生有毒和偏见内容。

Read More
2023-09-27 talkingdev

【非常实用】带注解的AI研究论文合集

GitHub上有一位名叫Useful Annotated Papers的用户创建了一个代码仓库,这个仓库集合了许多来自各领域的标注论文,内容丰富而有深度。这些标注论文的内容涉及广泛,包括但不限于人工智能、机器学习、深度学习、自然...

Read More
2023-09-25 talkingdev

EmoPP模型开源:实现情感感知的自然语音合成

近日,一篇研究论文介绍了一个名为EmoPP的模型,该模型融入了情感线索,以实现更准确的韵律分词预测。作者强调了韵律分词在实现自然 sounding Text-to-Speech(文本到语音)过程中的重要性。韵律分词是一种基于语音...

Read More
2023-08-21 talkingdev

论文:高效评估文字至图像生成的新方法

目前,评价从文本生成的图像质量的方法存在一些问题,如无法真实捕获图像的美观程度或与文本的匹配程度。最新的研究论文介绍了一种新的方法,该方法可以估计生成的图像与给定文本的匹配程度,重点关注图像的最重要部...

Read More
2023-08-15 talkingdev

AI Town开源:虚拟城市中的AI角色互动

AI Town是一个虚拟城市,其中的AI角色生活并相互交互。这个仓库包含了一个可部署的起始套件,方便构建和定制自己的AI Town版本。该项目受到了一篇研究论文的启发,旨在提供一个强大的基础平台,可供扩展。

Read More
2023-07-28 talkingdev

CFSum-提升多模态摘要的全新工具

一项新的研究论文介绍了一种名为粗细贡献网络(CFSum)的全新工具,旨在提升多模态摘要中对图像的使用效果。CFSum能有效地筛选出无关紧要的图像,只利用对摘要内容有帮助的图像。这一工具的研发,将推动多模态摘要领...

Read More
  1. Prev Page
  2. 1
  3. 2
  4. 3
  5. Next Page