LearningGripper 看起来像是人手的抽象形式, 并且它的动作也跟其自然界原型有很多共同之处:拥有四根手指的机器人抓手利用机器学习过程自动学习将处于升起位置的球旋转到任何指定的方向上。
只有提前定义好 LearningGripper 的手指的基本动作和可能位置,以及来自环境的反馈功能,才能进行这种复杂的抓取。只要告知抓手需要做什么,而不是怎么做。为此所需的移动策略由抓手的学习算法独立进行开发,无需任何进一步的编程。
理论表明,我们人类之所以如此聪明,是因为我们的手可以解决很多复杂的任务。婴儿很早就开始抓东西,比如其母亲的手指。一旦我们学会正确地抓住一个物体,我们就可以把它转过来,从四面八方观察它。这是在头脑里重建物体三维图像的唯一方法。所以,手也有助于我们人类进行学习。
机器的学习方法与人类相似:无论是积极的还是消极的——它们需要对自己的动作进行反馈,以便能够对其进行分类并从中学习。LearningGripper 采用增强学习法。抓手未被告知任何它必须模仿的具体动作。它完全基于对其先前动作的反馈来优化其技能。这样它就更有可能执行成功的动作,而不会重复不太成功的动作。
抓手的四根手指由总共十二个气动波纹管驱动器驱动,压力低至 2.5 bar 至 3.5 bar 之间。四根手指中的每一根都有三个自由度和食指的基本功能。因此,仅在初始状态下,整只手就有总共 3¹² 个动作来重新定位球。得益于手指和柔性波纹管结构的智能协调,抓手的运动装置具有自由移动性和灵活性。它甚至可以安全地抓住、举起和旋转最敏感的物体,就像其自然界原型一样。
在 LearningGripper 展会上,第一个抓手展示了如何在一小时内以机械方式学习运动策略,以及如何在不到一小时的时间内学习机械运动策略——从第一次尝试到可靠地完成规定任务。第二个抓手展示了指定目标场景中的学习过程:它举起并转动球,以便末端的浮雕字母显示在顶部的中间位置。