以下文章来源于万有青年烩。机器人和电脑的区别是什么?我认为区别在于操作的能力。举个例子,Siri,是一个很聪明的电脑,它可以跟你对话,但它不能拿东西,它没有办法去操作任何现实世界的物品。但一提起哆啦A梦,你会觉得它是一个机器人。大家仔细观察哆啦A梦是怎么拿东西的?你会发现它会伸出一个小手指。
不记得是2011年还是2010年,PNAS曾发表一篇论文,由芝加哥大学、康奈尔大学几个研究组一起合作,研究出了一个现实版的哆啦A梦的手。这个东西有几种不同的实现,它的原理非常简单。机械臂如何完成一个动作路径?Manipulation(操控)主要分成三个部分,这也是机器人做任何具体的动作,做任何具体的事情要经过的三个步骤,分别是感知、规划和操作或者是运动。
我们做了一个通用机器人,它的实现形式是一个移动的操作臂,也就是机械臂,叫做mobile manipulator。机器人从底座的移动到机械臂的移动,到如何实现对物品的识别,到抓取,到避开,都是完全自动的,没有任何的人工帮助。这本身也是两台机器人配合的一个过程。感知:描述周边环境先讲第一个感知的部分。感知就是要描述你周围的世界,你周围的环境是什么样子的。
这是借用现在最火的自动驾驶的图,自动驾驶其中很重要的能力就是感知。而我们目前集中力量做的,也是做真正有操作能力的机器人需要攻克的难点,是pose estimation,也就是判断一个物品的姿态。那么感知还有其他的方式,比如说触觉。
在所有的这些事情里面,科学的部分和工程的部分,其实并不是泾渭分明的,但是大家可以看到哪些部分属于科学,比如说光学、比如说电的基本原理,电阻是怎么工作的,电路本身是怎么工作的,比如说在做视觉识别的时候,怎么做模式识别,怎么用神经网络判断什么东西是什么,在什么地方,这都是属于科学研究的部分,特别是像计算机里面相关的内容,都是属于我们叫做形式科学的部分。
那么工程部分则涉及到,比如说视觉这件事情,就涉及到你如何去组视觉的服务器,你如何选镜头,你如何搭建后面的算法,你在算法实现成代码的时候,你如何取组织代码,包括传感器你如何去选材料,如何去制作,这就是工程的部分。
运动规划:怎么从A点到达B点在sense-plan-act大图里面的第二块,也是最主要的一块,是Motion Planning,或者叫运动规划,就是解决如何从A点移动到B点,不碰到周围的障碍物的问题。运动规划讲起来是一个比较大的复杂的话题,简单说明一下。抓取规划:怎么抓取物件?而grasp planning则是解决机器人怎么去抓取一个物体的问题。
执行:让机器人执行规划下图是一个机器人执行规划时的一个示意图。这个是最经典的控制机械臂运动或者任何的执行器运动的经典的算法叫做PID。下面给大家看一系列的制品,这些都是日本东京大学做机器人执行做得很好的一个实验室做出来的。
所有的效果实现都需要在科学上解决,比如说传感器本身是怎么工作的,电机是怎么工作的,如果做模式识别,在理论上如何解决模式识别这样的问题,在实现的时候你要选造机械手你要选择传感器的材料。如果大家看完还觉得机器人的科学性不够强的话,可以看一下这个。这是斯坦福大学一个叫BDML实验室做的,基于壁虎爬墙利用的范德瓦尔斯力,在机器掌心做了个非常非常小的执行器,可以让壁虎形的机器人能够实现爬墙的效果。
最后的最后,再分享一个有趣的东西,还是刚才那个东京大学做的——通过高速的相机,高速的执行,高速手的tracking、跟踪,可以实现百分之百胜利的猜拳机器人。