漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2023-09-22 talkingdev

论文:模型如何理解声音和视觉的结合?

这项研究介绍了AV-SUPERB,这是一个新的基准测试,用于测试训练模型在各种任务中对声音和视觉数据的理解程度。AV-SUPERB的目标是推动音频和视觉共同理解的发展,并为未来的研究提供一个统一的平台。这项研究突出了模...

Read More
2023-09-21 talkingdev

理解手部动作的更佳途径:RenderIH与TransHand的全新应用

最近的研究引入了RenderIH,这是一个包含各种手部位置的超现实图像的庞大收藏,解决了旧数据集过于简单的问题。同时,研究还呈现了TransHand,这是一个能够非常精确读取这些手部位置的新工具。RenderIH的引入,不仅...

Read More
2023-09-19 talkingdev

打破维度界限:2D与3D图像创作的无缝融合

科研人员已经找到了一种方法,使得2D和3D技术能够无缝地协同工作,以实现更优秀且更具灵活性的设计。这种新的技术能够打破传统的维度界限,为图像设计领域带来革新性的突破。不仅如此,该方法还能大大提高图像设计的...

Read More
2023-09-15 talkingdev

论文:打造更优质的推荐系统,模型HAMUR的研发和改进

科研人员已经开发出一种新的模型,名为HAMUR,以改进模型在多个主题或领域(如音乐、书籍或电影)中的推荐方式。与旧的方法混淆这些领域之间的信息不同,HAMUR采用了一种特殊的技术,使数据保持独立且更具灵活性。这...

Read More
2023-09-13 talkingdev

论文:人工智能获得嗅觉,准确识别气味

科研人员成功训练出一个模型,通过使用自定义的数千种手动标记分子的数据集训练图神经网络,使其能够准确地识别气味。这是人工智能在模拟人类感知能力方面的一次重大突破,标志着人工智能在感知世界的能力上迈出了新...

Read More
2023-08-30 talkingdev

论文:利用扩散模型提升安全性:DiffSmooth模型稳健新纪元

科研人员正在探索一种名为“扩散模型”的新方法,以增强已进行训练的模型的强度。这种新方法被命名为“DiffSmooth”,通过使用扩散清理数据,然后利用特殊的平滑过程让模型变得更加可靠。这一创新方法的提出,意味着我们...

Read More
2023-08-28 talkingdev

论文:研究者开发出更好的工具检测AI语言模型的偏见

科研人员已经开发出一种名为CALM的新测试,用来检查AI语言工具是否存在偏见。他们从不同的来源收集了大量的数据,并测试了各种AI模型,结果发现一些大型AI模型的偏见可能比较小的模型更严重。这一发现对于AI领域的研...

Read More
2023-08-28 talkingdev

微软开源DeepSpeed训练长文本模型

DeepSpeed是微软推出的一个库,可以用来扩大语言模型的预训练。虽然使用起来有些复杂,但它提供了强大的抽象功能。微软最近添加了序列并行性,可以训练具有更长上下文长度的模型。这并不是一个新的突破,而是对开源...

Read More
  1. Prev Page
  2. 4
  3. 5
  4. 6
  5. Next Page