漫话开发者 - UWL.ME 精选全球AI前沿科技和开源产品
2024-02-13 talkingdev

强化学习算法的技能集优化

近期,将一种强化学习代理的技能转移到另一个代理上一直是一个挑战。但是,一项新的技术优化了一套可以在不同环境中使用的技能集,表现出很好的泛化性能。研究人员通过对一种基于技能的代理架构进行修改,将技能集的...

Read More
2023-04-28 talkingdev

学习敏捷的足球技能:强化学习

这项研究利用深度强化学习(Deep RL)来训练一个低成本、小型的人形机器人,通过20个关节来玩一个简化的1v1足球比赛,从而开发出了稳健和动态的运动技能和基本战略理解。高频控制、有针对性的动力学随机化以及模拟训...

Read More