近日,在2025中关村论坛年会期间举行的硬科技嘉年华上,不少嘉宾和机器人互动。“可以踹,也可以下铲。”现场工作人员介绍,这是一款平衡两腿机器人,机器人在模拟环境中探索各种平衡,在训练中,如果找到一个很好的平衡方法时会给它一个“正向”奖励,在无限次的模拟环境中,最终让它无论遇到什么场景都能保持比较好平衡性,这就是强化学习算法的一个优势。(记者 吴涛 实习生 刘向宇)

(图片来源网络侵删)