漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-09-16 talkingdev

思维链助力变换器解决序列性问题

随着人工智能领域的不断发展,变换器(Transformers)模型在处理序列性问题方面表现出色。近期的研究表明,思维链(Chain of Thought)技术能够进一步提升变换器的效率,尤其在解决需要多步骤推理的任务时。这一方法...

Read More
2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日,一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器(Trajectory Diffusion Transformer)和多视图...

Read More
2024-05-21 talkingdev

研究人员发现针对视觉变换器(Vision Transformers)的新型后门攻击手法

近日,研究人员发现了一种针对视觉变换器(Vision Transformers)的新型安全威胁。这种被命名为“SWARM”的攻击手法,利用一个“切换令牌”秘密激活模型中的后门行为,使其对用户具有高度的隐蔽性和危险性。视觉变换器是...

Read More
2024-05-21 talkingdev

论文:LeMeViT利用可学习的元Token实现快速视觉变换器

最近,一种名为LeMeViT的新方法用于降低视觉变换器中的计算成本,其核心策略是使用可学习的元令牌。这些令牌能够有效地捕获关键信息,从而提高推理速度。视觉变换器在计算机视觉领域有着广泛的应用,然而其计算成本...

Read More
2024-05-16 talkingdev

论文:英汉文本到图像生成新标杆,混元-DiT的突破性发展

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆,特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道,为持续的模型改进提供了可能性。而这一突破性的发展,不仅提升了英汉文本...

Read More
2024-04-04 talkingdev

论文:自动驾驶新突破,全球中心扩散变换器技术引领未来

最新研究表明,一种名为'全球中心扩散变换器'(World-Centric Diffusion Transformer,简称WcDT)的技术为自动驾驶汽车的路径规划带来了革命性的创新。该技术融合了扩散模型和变换器,旨在提高自动驾驶汽车在复杂环...

Read More
2024-03-28 talkingdev

OPTIN框架:无需额外训练提升AI模型效率

OPTIN框架是一个创新的方法,用于提高基于变换器的AI模型在各个领域的效率,而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术,可以在特定约束下压缩网络,同时几乎不影响其准确性。通过这种方法,可以...

Read More
2024-03-20 talkingdev

IBM与NASA联手打造语言模型 助力科学知识普及化

IBM与NASA的合作项目成功开发出基于先进变换器架构的语言模型,这些模型经过科学文献的训练,旨在提升自然语言理解任务在科学领域的性能。这些模型现已在Hugging Face上开源,供全球开发者和研究人员使用。此举将有...

Read More
  1. 1
  2. 2
  3. 3
  4. Next Page