变换器的相关内容 - 漫话开发者

2024-06-27 talkingdev

Director3D开源-现实世界3D场景AI生成框架

近日，一款名为Director3D的新框架引起了行业内的广泛关注。这款框架的设计目标是提升现实世界3D场景的生成和相机轨迹的模拟。Director3D运用了一种名为轨迹扩散变换器（Trajectory Diffusion Transformer）和多视图...

2024-05-21 talkingdev

近日，研究人员发现了一种针对视觉变换器（Vision Transformers）的新型安全威胁。这种被命名为“SWARM”的攻击手法，利用一个“切换令牌”秘密激活模型中的后门行为，使其对用户具有高度的隐蔽性和危险性。视觉变换器是...

2024-05-21 talkingdev

最近，一种名为LeMeViT的新方法用于降低视觉变换器中的计算成本，其核心策略是使用可学习的元令牌。这些令牌能够有效地捕获关键信息，从而提高推理速度。视觉变换器在计算机视觉领域有着广泛的应用，然而其计算成本...

2024-05-16 talkingdev

最新研发的混元-DiT在文本到图像扩散变换器方面设立了新的标杆，特别是对于英文和汉文。这一技术特征包括先进的变换器结构和精炼的数据管道，为持续的模型改进提供了可能性。而这一突破性的发展，不仅提升了英汉文本...

2024-04-04 talkingdev

最新研究表明，一种名为'全球中心扩散变换器'（World-Centric Diffusion Transformer，简称WcDT）的技术为自动驾驶汽车的路径规划带来了革命性的创新。该技术融合了扩散模型和变换器，旨在提高自动驾驶汽车在复杂环...

2024-03-28 talkingdev

OPTIN框架是一个创新的方法，用于提高基于变换器的AI模型在各个领域的效率，而无需进行重新训练。该框架采用了一种称为中间特征蒸馏的技术，可以在特定约束下压缩网络，同时几乎不影响其准确性。通过这种方法，可以...

2024-03-20 talkingdev

IBM与NASA的合作项目成功开发出基于先进变换器架构的语言模型，这些模型经过科学文献的训练，旨在提升自然语言理解任务在科学领域的性能。这些模型现已在Hugging Face上开源，供全球开发者和研究人员使用。此举将有...

2024-03-19 talkingdev

最新研究项目YOLOX-ViT在水下机器人领域中引入了一种创新的目标检测方法，该方法通过整合视觉变换器（Visual Transformers）和知识蒸馏（Knowledge Distillation）技术，显著提高了目标检测的准确性和效率。该技术的...