服务及特种机器人发展趋势探讨

时间:2018.12.13(下午)

地点:潍坊市蓝海酒店(御礼厅)

主题:服务及特种机器人主题会议

主持人:尊敬的各位来宾大家下午好!

我们今天下午是本次大会的服务及特种机器人主题论坛,我是今天下午的主持人陈小平。首先欢迎各位来到我们下午的会场,我先介绍一下今天下午演讲的嘉宾。他们是:

中科院深圳先进技术研究院智能仿生中心执行主任吴新宇

香港中文大学(深州)机器人研究院院长张爱东

英特尔中国研究院机器人创新实验室高级总监、博士、首席研究员张益民

百度机器人和自动驾驶实验室资深研发工程师和美国北卡罗来纳中央大学终身副教授黄新宇

苏州大学机电工程学院院长孙立宁

海尔服务机器人产业总经理杨军

今天下午的内容非常丰富,首先热烈的欢迎中科院深圳先进技术研究院智能仿生中心执行主任吴新宇先生进行演讲。吴新宇博士是深圳中科院深圳先进技术研究院研究员,博士生导师,国家万人计划科技创新领军人才,国家中青年科技创新领军人才,科技部“十三五”国家重点研发计划、智能集群专项专家组成员,科技部“十三五”国家重点研发计划、公共安全专项指南撰写专家组成员,也是中科院深圳先进技术研究院智能仿生中心执行主任、中科院人机智能协同重点实验室副主任,广东省机器人与智能系统重点实验室执行主任,广东省机器人产业技术联盟创新联盟副秘书长,深圳智能机器人工程实验室主任,他的演讲题目为:穿戴式外骨骼机器人系统。掌声有请!

u=925730123,667470365&fm=173&app=49&f=JPEG

吴新宇:很高兴有幸受到陈老师的邀请,能够在这样一个隆重的大会中,跟大家分享一下我们在外骨骼方面做的一些研究工作。我们是从2012年开始做外骨骼机器人,到现在已经有了六年的研发基础,下面开始我的一个汇报。

首先讲一下我们面临的研究问题和目前的现状。我国的助残的形势非常严峻,脊椎损伤每年有一万的速度在递增,总共有100万人,这些大部分可能是坐在轮椅上,我们如何把他们解放出来。另外中风患者每年新增200余万,其中近2/3受困于偏瘫的后遗症,也需要外骨骼或者康复辅具来帮助他们。外骨骼机器人能够帮助下肢运动障碍或者衰退的人群,能够帮助他们产生助力和助行,能够帮他们提高生活的能力和生产的质量。另外外骨骼在建筑行业,在制造业,特别是在很多现在的物流行业、也有非常大的需求。比如说在物流行业,现在日本很多机场搬运和公共汽车周边的搬运已经用上了外骨骼。中国有一些物流公司统计,他们的员工平均每天要弯腰搬运2000到3000次,一般来说一到两年一定会得腰间盘突出,所以这确实是非常大的一个刚需,做腰部助力的外骨骼机器人。从国际前沿的角度来说,最近我们机器人出了一个专刊,有两篇文章都是外骨骼相关的,第一篇是德国图宾根大学设计的一个基于脑电控制的上肢外骨骼,这个机器人能够通过脑电信号的控制,能够帮助四肢完全瘫痪的病人完成一些抓取,比如说吃饭这些服务的动作。另外一个是哈佛做的柔性的助力外骨骼,可以减少23%的穿戴消耗。国外有很多的公司大部分都是做截瘫病人的,目前慢慢延伸到了中风或者助力其他的领域。从整体外骨骼的趋势来看,最早是美国的一些大学,最早做的是军用外骨骼,慢慢的向助行、助残转移,最终的发展趋势是要方便,要实用,还要注重老人和残疾人的高安全、高可靠性。

外骨骼同时也存在很多的挑战性问题。最重要的是在运动意图的识别方面,特别是给老年人或者部分正常人怎么识别他们的运动意图。比如说老电信号全局性强,但是解码技术不成熟,无法拿到非常好的结果,机电信号对于某些运动失能的残疾人并不适用。还有力反馈运动信号等等,我们的研究是如何融合这些信号,能够取得比较好的意图识别的结果,是我们未来研究的一个重点。另外一个就是外骨骼的步态和规划与生成效果还不是太好。每个人的步态可能是不一样的,用其他人的步态来替代穿戴者的步态肯定是不现实的。或者是建立步态数据库,从中选择身体参数相近的步态,这可能也是一种方法。还有建立身体的运动学和动力学模型,通过模型来自动分析建立步态。但是这都达不到特别好的效果,我们在实验中也用过。外骨骼会产生人的智能和机器智能的冲突,如何把这种冲突变为互补和融合,也是未来要解决的方向,通过协同控制,通过高级的融合。我们这个研究主要集中在三个科学问题,一是多模态融合的意图识别,二是自然高效的外骨骼机器人的仿生的步态规划,也包括外骨骼和机器人之间的无缝融合和协同控制。

我们的首要的科学目标就是希望能够探索升级多模信号表征模型和融合控制策略。我们的主要研究内容主要在四个方面,首先是外骨骼的仿生机构创成与人机耦合系统建模。所以我们要拒绝外骨骼的建设与人体的生理参数和运动功能如何相容的问题,通过建模探索人体和外骨骼耦合接触刚度变化,能够具有支持性能力的控制力的外骨骼的机械设置。在信号融合这一块,我们希望我们的方法能够融合EEG、EMG、足底力、关节角度和人机交互力等等方面做了一些分析,能够得到判断的意图,当然我们有很多的方法来做这一块。这个就是说我们步态建模能不能通过深度学习达到比较好的步态建模。因为传统的基于动力学的约束比较严格,它们生成的步态比较僵硬,不适合人机协同的场合。利用LSTM框架,能够表达不同的身体参数、行为方式特征的通用性人体步态模型。我们也希望我们的步态模式能够自适应学习,使得人机都有比较小的消耗。这是我们的人机协同控制的框架,我们能够得到包括脑机机电还有人机状态与环境信息、人机状态,把这些信号都放在模型选择当中,通过FDS实现人机的协同控制,同时生成比较合适的自适应的步态。

介绍一下目前研制的样机系统,最早研制的样机是在2013、2014年做的,我们现在做到了14公斤左右,这一套外骨骼样机主要是在髋关节和膝关节有四个电机对残疾人进行主动的控制。在髋关节摆动和髋关节的被动随动这一块有两个自由度,在踝关节也有一个自由度。我们采取了欠驱动的机械设计结构,并且基于人体仿生学的结构设计,可以使得我们外骨骼适应一米六到一米八五的人体不同的生理参数,可以采用我们的外骨骼机器人。我们这里主要是采用直流伺服电机通过滚珠失杠采用这样的驱动方式。这是我们的传感器系统,包括我们有脚底压力,我们有测量关节角度传感器的信息,我们也有压力传感器,在腰部还装了腰部陀螺仪传感器,进行运动的意图的判断。这是我们的智能拐杖,因为残疾人可能下肢无法检测到它的信号。所以我们要么通过脑机控制,要么通过简单的智能拐杖的按纽控制来控制残疾人的行动。我们也做了自主的神经肌肉的控制的一些初步研究,包括通过臀大机,上下楼梯的动作进行分类我们也达到95%的识别率。在脑机接口这一块,目前还比较难,识别率还比较低,只能作为一个开关量对机器人进行控制。

在步态相位识别这一块,我们采用了一个比较创新的研究成果,就是采用单一的传感器降低了整个传感系统识别的复杂度。因为传统的方法要识别步态处于什么位置,我们需要用角度传感器甚至加上陀螺仪,还要加上脚底压力传感器,我们这一套人工智能算法只使用关节上装的角度传感器,就可以对步态相位进行识别。另外我们做了步态膝关节的建模,主要就是我们有很多病人,比如他左腿的膝盖可能是有问题,那么他左腿的步态是有问题的。我们也可以简单的只是把右腿的步态放到左腿上去,我们这里的研究是在右腿是完全健康的状态下,我们怎么拿到右腿完整的数据和和左腿部分正常的数据,来预测出它的膝关节能够给它什么样的步态的数据,这是我们做的一个研究成果。我们采集了大量的健康人的行走数据基础上,通过深度学习进行了建模,可以根据用户的正常的关节轨迹来预测出异常的关节轨迹,建立了膝关节和其他关节时空的关系。

这是我们采用了传统的RNN和带有LSTM的比较结果,发现LSTM的效果会好很多。这是我们自己按照国际上的标准做的一个检测能量消耗的方式,我们给这些人都带上一个检测心率的,通过心率的检测来判断他的步态是否适合他。这是人在休息时候的步态,蓝色的是这个人自己的步态,就是心率也比较低,红色的是我们预测出来的步态,我们把某个正常的腿加一些限制,使得他模仿残疾人,最后预测出真正的步态是什么样的,大家可以看出心率的变化非常接近。假设我们用其他的方法得来的步态,效果就非常差,他穿上以后走同样一段距离,心跳的速率比较高,这也从某一个角度证明我们这个算法的有效性。这也是我们如何生成个性化的步态,我们也做了一些研究工作。在这里我们采集了和步态相关的21个身体参数,建立了一个有33个人的身体参数的步态数据库。我们希望随便来一个人,简单的采集一下他的身体参数。我们也通过自动相关确定的高斯过程回归模型也得到了一些比较好的效果,这些数据是我们从33个受试者中随机采集,选取了5名作为测试集,其余的28个作为训练集。最后也得到了一个比较有意思的结果,就是我们可以得到哪些生理参数对人体的影响比较大,包括人的腰围、体重、身高甚至年龄,还有两个髋之间的外髋,还有对于一些步态特征影响比较弱的因子。所以我们又得到这些结果以后,又把影响比较弱的参数都去掉了,把比较重要的拿出来重新进行训练,也得到了比较好的结果。我们可以看到在步长预测的偏差也比较小,步态轨迹预测的相关性的误差也比较小。这是我们跟很多医院采用的一些病人做了一些实验,这是我们实验的一个视频。这是我们的测试,它是腰以下完全没有知觉的病人,他很想能够从轮椅上站起来,通过穿戴外骨骼能够自己站起来走起来,希望这个能够帮助他们实现生活自理。现在中国有很多公司也在做这一块,很多公司也都是集中在这一块做研究。

另外我们做的研究就是怎么体现人机共融。我们把外骨骼机器人加上了视觉反馈,引入了眼睛,使得外骨骼机器人能够适应复杂的行走环境的能力。我们可以拿到深度图象,从中残疾到点云图,我们就可以得到障碍物距离机器人的距离,包括这个障碍物的高度、宽度都可以采集到。这是我们对高度障碍物采集到的结果,平均误差小于2个厘米。人在看到一个障碍物的时候,在跨越之前,大脑会产生一个跨越意图,所以我们要采用脑机信号检测这样一个意图。这是我们通过不同的频段的脑电信号,最后融合了这两个脑电信号,得到了比较高的识别率,就是通过脑机信号来检测到人有想跨越这个障碍物的意图。有了跨越意图以后,实际上这只是人的智能就是我想跨越。那么机器人到底能不能跨越,要通过机器智能和人的智能结合起来,来判断到底能否跨越这个障碍物。我们也做了一个行走中对地面物体的自主决策的流程图,包括我们要检测前方有没有物体,还包括前面物体的距离和困落的尺寸,物体的距离是否大于安全行走的距离以及物体的尺寸是否超过了外骨骼机器人可跨越的范围。所以我们通过各种判断条件,最终通过人机协同控制来判断我们该不该跨越这个障碍物还是停下还是应该绕开。这是我们做的一个Demo。这是深度相机视角看到的,这是我们从侧面拍摄的。同时通过脑机信号判断他想跨越,最后通过环境感知发现这个障碍物是可以跨越的,我们的机器人就可以实现跨越。

另外刚才我们讲了很多外骨骼是这种带拐杖的,我们实际上是要带一个拐杖,就是残疾人在双腿完全没有力量的情况下靠拐杖保证身体的平衡。实际上有很多病人是高位截瘫,实际上经过美国的脊椎受损患者2018年的统计,美国有1万7千多例,其中有58.7%是高位截瘫,是到胸椎以上的,手都不能动,这些人我们如何帮助他们进行行走康复,这也是一个研究的重点。这个图就显示如果你上面是一个半截瘫患者,他可以通过拐杖或者一些辅助自身的设备,我们用髋关节、膝关节驱动的方案就可以实现他们的站立行走。针对高位截瘫,他们的手完全没有知觉,也不能动,我们只能采用全关节驱动办法来采用机器人的自平衡行走。通俗的意义就是可以想象,实际上是把人放在一个人型机器人上面,这个人型机器人能够完全平衡完全行走,这是我们做的一个系统的总体框架,也包括我们通过摄像机实现了机器视觉,包括建图、定位、路径规划,也通过AI演进将行走路径演示给使用者看,那么使用者这边我们也采用了脑电、机电以及意图理解,可以得到一些控制的指令,将这些指令交给机器人,机器人还需要通过在IMU力矩传感器、压力传感器和编码器实现传感系统来知道自己的系统,从而实现稳定的行走。

我们的机械设置采用了模块化的设计,它相同的组成和相似的结构,便于我们随时拆卸和安装维护,同时我们可以依据不同的负载的使用者进行驱动单元的更换。这是我们目前做到的一个初步的成果,我们目前机器人还没有完全上人,目前我们刚刚的结果是有一个假人,150斤的假人在上面行走,再下一步是到正常人,再下一步才是到真正的高位截瘫病患。所以我们目前做的实际上就是实现了一个人型机器人它在行走。

那么未来我们要装一个高位截瘫病人在上面走,这个难度比单纯做一个人型机器人还要难,因为上面如果装一个人,相当于带了一个位置的绕动,比人型机器人的难度还要大,上面的人可能重量各方面都不一样,这个研究我们还在继续。

另外我们还做了基于柔性传动的全身助力外骨骼机器人。我们将我们的电机驱动器全部集中在它的背包里面,采用了刚柔并济的一个方案。通过这个我们就可以帮助人实现不光是腿、手,可以帮助人搬重物。这就是我刚才提到的在快递行业、建筑行业很多行业需要做的腰部助力的外骨骼机器人,目前也有很多公司在这一块集中研发,目前做的比较好的是松下,这个机器人做的需要比较轻,价格也比较便宜,我们的物流公司才有可能会采购,要穿戴方便,要快穿快脱。在你弯腰的一瞬间,检测到你的运动意图,然后它就会帮助你起来,这是在腰部保护。

最后一个就是我们做的柔性外骨骼。柔性外骨骼可能是未来的一个发展趋势,不管是在军用还是民用,给老年人和残疾人这一块的研究,我们做的主要是柔性驱动的综合创成和协作控制,还包括人机系统的运动协调和平衡控制技术,还有多模物理与认知双向交互的综合控制策略。包括外骨骼的机构设计髋关节和踝关节,它的难度主要是绑缚设计这一块。另外柔性驱动,包括髋关节、踝关节,另外难度比较大的还是人体的运动感知,如何通过传感器感知到人的运动意图。

这是我们的运动的感知系统,包括我们做的带无线网络的足底压力传感器,人身上装了加速度器还有陀螺仪,综合这些我们可以得到控制的角度、距离等信息,包括人的运动信息,最后给大家看一下我们目前做的一个视频。我们这个机器人跟哈佛做的相比有几个优点,我们一个电机可以双向驱动,哈佛只能驱动一条,于是他们的重量比我们重,哈佛现在做到了9公斤,我们做到了4公斤。另外我们可以支持多种地形,包括平地、上下楼梯、包括突然的变速,我们的机器人能不能跟上,意图理解能不能跟上,我们目前都可以做到这些。另外我们还做了一个在机器人可以实现的快脱快穿,这个也非常重要。这是我们的机器人在做平地的行走,目前我们的机器人可以达到正常在五公里的速度下,支持人走4公里,这个基本也够了,一个老年人出去散步、走路,包括爬楼梯,老年人的膝盖有不方便,我们的机器人也可以帮助他们做。而且这个成本也非常低,成本只有几千块,所以未来的发展趋势应该是在柔性外骨骼如何能够帮助老年人,帮助他们能够行走。这是我们在跑步机上演示不同的变速的情况下,我们的意图理解和控制系统能够实时的跟进。最高可以到每小时7公里,我们正常人走得比较快的话是每小时5公里左右,这是我们的快脱快穿,可以很方便也很轻便,现在4公斤我觉得完全可以给老年人用,脱下也很快,30秒之内可以把它脱下来。

我的报告就到这里,谢谢各位!

 

主持人:非常感谢吴新宇研究员的精彩报告,对外骨骼机器人有一个非常系统的深入的介绍,也让我们看到了中国在这个领域的一些最新的最先进的研究成果。下面我们有请第二位演讲嘉宾张爱东院长,张爱东博士是香港中文大学深圳机器人研究院院长,也曾在华为任职,2016年至今在香港中文大学任机器人与智能制造研究院院长。他带领的团队在机器人与智能制造领域取得了很多先进的研究成果,包括机器人本体、智能感知与认知、异构机器人网络与协同等领域。让我们以热烈的掌声欢迎张院长给我们作演讲。

张爱东:谢谢大家!我来自深圳,是香港中文大学机器人与智能制造研究院,我们研究院的成立只有三年,所以这里的成果可能在很多的老机器人专家眼里还比较稚嫩。我演讲的题目是从特种机器人从仿生到超越生物。

我们先看一个小的生物,这个叫尺蠖,这是一个人在怎么仿生,一个人怎么像生物一样的爬树,他用了一个很简单的工具,就是人在仿生的时候,其实用了很多简单的如果我们从技术上分析的话,可以分析出很多现在我们机器人还没有做到的事情,他就是一个简单的草或者是树藤条做的圈子,他非常快的就可以实现向上爬,我们现在要想做一个这样的机器人能往树上爬是非常难的一个问题,他用简单的一种方法,把下滑的摩擦力都用到支撑他整个人的身体上,这个仿生我们现在还没有做得到这一步。我们的机器人现在还多数处于一个很小范围的运动,有时候我们做特种机器人都是从生物出发,现在没有谁能够做到这样的机器人。这个把摩擦力还有运动的控制都做得天衣无缝,就是我们机器人在做仿生的时候要分析很多问题,我们做来干什么用,这是很重要的,也许分析了做来干什么用的时候,我们最后就会放弃仿生,就是很单纯的仿生这样一条技术路线。

这是我们的一个博士生做的一个题目,曾经获得了最佳论文,我的一个总结,能在这个学术会议上能获最佳论文通常都是简单,所有人一看就懂的东西。本身这个机器人的本体非常轻,才几百克,现在大家可以看到它下面带着重物是3到4倍自己的体重。其实我们做机器人很多场合要做的就是考验一个负重能力,我们做机器狗的有不少人,小的机器狗是非常容易做的,但是大的机器狗非常难。这是一个当时学生做的了,其实他并不知道做了干什么用,就是这么一个小东西往树上爬,但是爬上去干什么呢?是监测病虫害还是监测火警呢?这个都不知道,因为学生做的就是一个人一个创意,最后就可以实现学术上的一个小突破。我们沿着这条路也有很多可以产业化应用的东西,我们今天这个会主要还是产业界为主。这样一种伸缩结构的机构,我们可以用到电力线的巡检上,这是我们之前做的一个原型,就是在跨越障碍的时候,你怎么过这些绝缘子连接点的地方,目前是非常困难的事情。其实还有一个更困难的事情,这种机器人都是几十公斤上百公斤重,怎么到这个电力线上困难也非常大。所以在电力线检测的场景里,存在着不只是在线上跑,还存在着从地上到线上的过程。我们提出了这么一个方案,能够跨越这个障碍,但是这个离真正使用还有非常大的距离。所以我们后来又选了一个相对电力线检测来说更简单的场景,这里还有一个爬跃的过程,这里有两个夹子,这个夹子先松开,等机器人跨越这个障碍之后再过来把它夹住。其实这里看的有一个问题,这个机器人并没有解决的就是这里给大家看的都是视频,并不是实景,这个机器人目前还不具备判断障碍的能力,只是从机械上具有跨越障碍的能力。

这是我们研究院成立之后的一个新项目,就是我们从电力线检测转移到另外一个应用的方向就是桥梁的检测,我们每年建的高速公路、高速铁路其中很重要的一个就是大桥,大桥现在按照最新的技术,这种线缆拉拽的桥是非常多的,它关系到桥的生命也关系到人的生命的工程,所以我们现在做了这么一个项目,就是沿着桥缆往上爬,也是来源于这种动物仿生式的原理。但是我们做这个机器人非常重要的两个因素,一是负重的能力,它如果不能负重的话,带不上检测设备,二是它的运动速度。我们看到这里有很多的数据,我们先看公路桥梁有80多万座,我们都知道中国对工程质量的监测虽然写在纸上的还可以,但是在实际的过程中不一定能够真正达到要求,这也是为什么建设和检测并重的一个原因。当然我们现在基础建设才刚刚开始不久,病害的爆发还没有到来,这里重庆交通大学有专门研究桥梁的团队,他们得出的一个数据是我们现在的设计寿命是30年,但是平均寿命可能只有一半左右,那么怎么来把这些有问题的桥梁和索缆尽早的检测出来,这是一个非常大的挑战。

我们看一下拉索桥有一些什么样的缺陷,有一些什么样的问题。我专门去跑过重庆一个造桥缆的公司,他们有非常多的问题,现场有非常多的出问题的。主要有几种,一是桥缆很多是钢丝缠绕,外面有一个PV的包裹层,第一个出问题的就是这个包裹层会烂掉,因为它是一个塑料的东西。二是我们的桥大家脑子里面都是缆的部分,它的两端其实是像一个很大的巨型铆钉的东西把它接在一起的,这个也是非常容易出问题的点。但是我们现在先关注在桥缆的线的部分,表皮的损耗,雨水会进入桥缆,会生锈,所以最后整个桥缆都处于一个受威胁的状态。

目前我们能做的事情是非常挑战的,要人这么吊着上去检测,也开始尝试用无人机做检测。但是大家也知道,无人机到桥上比在电力线上有更大的挑战,因为桥通常在河道的上方,它的高空的气流非常大,要控制无人机沿着桥缆上下去看是非常挑战的一个事情,这跟我们平时玩无人机航拍是完全不一样的环境。所以不管是桥缆表面的检测还是更深入到线缆内部的检测,都需要我们拽出很重的一个检测设备上去,包括电池的这样一种探测设备上去。所以这里我们设计的这个爬桥缆的机器人虽然是一个科研项目,我们是在深圳市科创委的支持下的一个项目,但是这个项目将来是面向应用来去研发的。这里面除了刚才大家看的比较清楚的这样一个交互式上爬的结构外,在一定程度上能够容忍桥梁表面缺陷的这样一个结构,它有可能是一个完全电机控制的强硬的东西,是一个欠驱动的通过机械方式的结构。这个结构可以容纳各种表面小的缺陷。

这个项目除了机器人部分,它还涉及到后台的大数据,我们这个桥梁每个桥有上百根的电缆,这样的数据要定期的检测,所以它除了机器人本身之外还有后台的数据管理。每个桥定期的巡检,然后它获得的数据都在一个数据库里面,这对于桥梁维护的单位来说是非常重要的一个产业的数据。

我们除了当前做的桥缆之外,因为还是一个面向产品应用的项目,所以也做了型号的设计,我们说桥缆有不同的缺陷,最多的是表面的破损。所以我们也做了重载的,就是现在能够在几十公斤的检测设备上做的一个,将来我们还会做一个更重载的项目,把更重的检测设备带上去。

刚才说了一个具体的项目,现在回到我们的题目上,从仿生到超生,超越生物。我们现在看到特种的机器人,这里讲的特种机器人就是在各种工业环境里面应用的机器人,它整体是可以移动的。我们研究院主要做的是能到处跑的机器人,包括恶劣的环境,这里仿生的除了仿运动能力,我们也进一步的有仿思维能力,就是运动感知认知这三个方面。简单的说一下感知,我们还做了一款小的熊猫机器人,就是用来做辅助治疗老年痴呆、自闭症和智力受损人群的机器人。在里面也有声音的识别、图象的识别,还有运动感知的,包括人和机器人接触的一些东西。这是我们做的另外一个项目,主要讲一下认知。刚才其实吴新宇也说了很多跨越障碍的,我们做了很多四足机器人,这个机器人也申请了专利了,用一个简单的二维的激光扫描仪把地形给扫出来了,然后这个机器人在内部判断他能跨越的就跨越,如果这个障碍太高了,它就会规划绕着走,这就是我们除了感知之外的认知,认知就是基于感知信息的一个判断。现在是基于一个位置控制的状态,但是我们要说其实这里面我们做的感知认知的这部分,它能在比较平缓的坡上。但是遇到这种障碍的话就比较挑战,没有针对比较高的障碍的相应的设计。

那我说超越生物,为什么要超越生物呢?我们为什么花了那么多钱、花了那么多时间,为什么一直没有商用呢?因为我们机器人的动力都是电机,是一种圆周运动的动力,真正的狗这些东西都是肌肉素来实现的运动,所以基于电机这种圆周运动来仿真肢体的折叠来实现跨越障碍,从工业的角度肯定是走了一个有可能是错误的圈子。之前我们校长还经常讲,接下来这个视频,总是给别人播这个,这个机器人看起来很土,就像老太太去超市拉的小车一样,三个轮子,这个东西我现在做了这么长时间的机器人,轮子本身就不是生物的东西,就是用轮式的方式实现跨越障碍的能力。这比我们的四足机器人,我之前是做通讯的,从物理来说,电机是圆周旋转的,这个机器人就直接用圆周动力来跨越障碍,所以它的效能非常高,我们做四足机器人有一个非常重要的问题,它的问题在哪呢?电机要是太快就没有力气,你要它有力气,它的速度就非常慢,大家都开车,就是把一个固定的输出能量的引擎能做出又要力气、又要动力的这样一个装置,现在在我们机器人方面比较少的,我们总是去选变速器、减速器,那么有没有人能够做核心关键部件呢?如果有哪个人能够做一个变速的减速器的话,一定是非常厉害的。但是这个轮式的机器人还是一个没有智能的,靠马力前进的东西。我们做一个好的机器人一定是智力、动力、感知三位一体才能做成一个好的机器人。

接下来,我想做机器人的除了各种机器人的技术之外,我从计算机的角度来看。我们看刚才说的动力的问题,圆周运动的电机去仿生肌肉是绕了圈子的一个路。第二,我刚才说波士顿动力为什么做得特别好,它的快速反应能力是非常好的,我们现在国内做机器人的可能对这一点,我不知道别人有多深的体会,你要做一个能够运动的,能够抗干扰的。像波士顿一样踹一脚不会翻的这种,非常重要的就是在快速反应这一块,它的快速反应到底有多快,这个是很重要的一点,我们现在国内做机器人的从计算机出来的人不是太多。

第二,现在我们做机器人的都是做单体的比较多,其实我们解决一个工程的任务,或者最极端的一个国防的任务,它一定是一个非常复杂的任务环境,我们做一个单体的任务是成本非常高的。你能做一个从地上爬到电力线上并且在电力线上继续爬的机器人吗?这是非常有难度的。在线上爬的归线上爬的,但是要让它配合起来,就是用一种分布式的思想来做一个机器人,这是非常重要的一点。就是机器人怎么能够批量的应用,这是一个非常大的挑战。能量这一块我想所有的人不会反对,机器人要出去走,现在就像智能驾驶汽车,跟电驱动的汽车是一样的问题,没多少能量出去,一个机器人要真正能用,它的工作时间是必须的一个条件,而现在我们的挑战是什么?你这个机器人背上了电池就背不上别的工作负荷了,这是一个问题。那这可能不是狭义的机器人领域的挑战,我们可能需要人员行业做这种能源的非常小的装置在当地进行转换,边采选能源边用。比如说我们的电力线检测,它的能源是非常高的,这种高压线边上的电厂是非常厉害的,你可以去用,这就是有可能的一种方式。

总结一下我今天讲的这么多,ABCD,我们做机器人第一个一定要应用驱动的研究,特别是对做仿生机器人的来说,不能为了仿一个生物就去沉溺其中了,我们要随时退出来看看是什么场景。有实用的场景才有科学问题,因为我们这个圈子就是学术里面的,老是你做一个东西问,科学问题是什么,没有纯粹的科学问题,你在用在什么样的环境下,才能逐渐的拆离出很多的科学问题来,所以A就是应用驱动研究。第二个B就是我们说的要仿生,超越生物。三是我们需要多技术的实时融合。四是我们要有一个分布式的仿生方案,来做真正能用的机器人的场景。第五个问题是逃也逃不开的能源的问题。

谢谢大家!

主持人:谢谢张院长非常精彩的报告,介绍了张院长领导下的一些科研成果的进展,我们现在中国人要超生,机器人也要超生,但是这两个超不一样。下一位演讲嘉宾是张益民博士,他是英特尔中国研究院机器人创新实验室的高级总监、首席研究员。他带领的团队研究领域包括个人服务机器人的自适应交互人机截面以及算法硬件加速等等等等,取得了一系列的成果,下面我们用热烈掌声欢迎张总给我们作演讲。

张益民:首先非常高兴得到陈老师邀请,在这里给大家分享一下我们在服务机器人这一块的一些研究的进展,我们在英特尔中国研究院在过去三年以来,一直在看到服务机器人这一块的研究,我们也希望能够突破一些技术的瓶颈,为产业界,进入这个行业的一些合作伙伴来提供一些基础的技术。

我们的愿景就是我们认为多动能服务机器人进入家庭,当然也包含在公共场所,为商场等等,为大家提供这种智能的服务,我们认为这个在未来是可能可行的了,就是在五到十年内可以变为现实。

我们也做了一些调研,就是在机器人这方面,它真的要进入市场,要成为大规模应用的产品,那么它有一些什么主要的需求,一些要素。我们认为从目前的分析看,要大规模进入市场一个就是它的成本可能还要进一步降低,就是整个机器人的成本可能要跟我们以前PC行业可能是万元PC的一个层次,这也是一个关键。二是要提供多种有用的服务,应用的需求要非常清楚,真正为人们去提供服务。三是要有一个良好应用的机器人交互,因为服务机器人主要的就是跟人去交互,跟人去提供一些基础的服务,我们另外认为它应该是可以自我学习的一些,像一些智能的服务,它这些功能的服务应该完全都是事先都训练好的,因为它要根据个性化有一些定制,这些我们认为是非常重要的,就是自我学习的功能。最后一块就是安全性,安全性就是服务机器人它是需要在进入家庭之后,因为它本身可以动,它可能会把人给碰着,另外它如果再有胳膊可以进行操控的话,对一些物体进行操控,这也会带来一些跟安全相关的问题,所以必须要保证它的安全性。

那我们可以看到,具体的服务机器人进入家庭之后,它可以带来什么样的应用,我们也做了一些分析,我们认为它可以作为对一般的用户,它可以作为助手或者伙伴,可以给家庭里面提供各种各样的最基础的一些服务,就是它使人们的生活更加方便。同时它在教育方面,因为机器人在某些技能方面确实在不断的提升,其实在这些方面,它可以对我们不管是小孩的教育还是成人、老人的再学习,都可以提供更多的想象空间,就是它其实可以帮我们把人的素质各方面都可以进一步的提高。最后我们认为未来社会中老人的比例越来越多,这个就是说对老人的看护我们认为是一个刚性,如果可以解决好这一点的话,既有很好的商业价值,肯定也是有非常重要的社会意义。

我们下面就是对养老看护这一块,我们可以想象一下在未来,像2025年,就是五到十年之内,真正它可以做到什么。我们这里就是说想象了一些应用场景,那么这些应用场景可能跟以往的你在科幻电影中看到的更为现实一点,比如说像这个老人他八点钟,王爷爷还没有起床,家庭服务机器人就可以通过它平时的观察感觉到王爷爷应该在这个时候起床了,没有起床它就在右边说,这个点还没起,我要去看看。另外就是再往下我就不一个一个讲了,比如说老花镜放在什么地方去了,老年人有一些健忘,有些东西放在什么地方可能不太清楚。这边机器人因为它平常就是专门对房间的环境定时不定期的进行扫描,所以它对一些常用的物体可以知道他放在什么地方,就可以帮助王爷爷找到老花镜放在什么地方。还有像王爷爷的心情有点低落,通过计算机视觉情绪理解的一些技术,可以去判断出来,机器人就可以和爷爷聊天。同时机器人聊天可能还是达不到跟人一样的这种水平,就是你要对老人的情感去关怀,可能这还是一个比较困难的,所以它还是会通知他的子女,给爷爷打一个电话,这样对他的情感进行关怀,这样让老人在家里面会过得不会感到孤独。另外机器人也可以看到,它并不是完全替代家庭成员对老人的关怀,它还是配合起来,作为一个助手。当然大家可能也会讲,是不是可以做饭,做一些保姆可以做的事情,这一块我们可以做一些更轻易的家务活,像端茶送水可能是可以的,但是重量不能太重,因为它对操控这一块成本要求比较高,如果作为家庭大规模使用的话,做一点轻一点的家务活是有可能的。

在这样一个场景如果可以实现的话,其实是很有用的,在这里面发现它还有一些问题,我们目前的人工智能技术还有一些问题,比如说你首先要对王爷爷或者奶奶,家庭不同的成员你要去认识他。我们发现目前的人工智能技术,人脸识别技术相对比较成熟,但是人脸识别技术的问题就是它只有看到正脸才能把人认出来,看不到脸或者侧面就没有办法认识,这是目前人工智能在认人、认物体方面还有可能会出错。另外像老花镜这样的物体,一般人工智能的方法都需要预先经过大量的数据去训练,但是它往往会发现你在家里面的一个特定物体没有办法去识别,这个时候你又没有办法去重新训练,这也是一个问题。另外像它里面还需要一些更多的对服务对象的一个了解,还有对人的个人习惯的了解,这就需要更多的知识。所以我们可以看到其实目前的人工智能技术,我们发现它还是存在各种各样的问题,比如说它最主要的就是这几个点,它可能并不是很确定,它有时候会出错,比如说认人有可能会出错,怎么去把这个人认识得更准。另外它还有一些功能没有经过训练的,新的物体或者新的任务是没法去做的。另外我们也觉得还缺少一些知识,这些知识最好是到环境里面跟个人比较相关的知识,比如说个人的习惯,他起床大概在什么时候,这些知识可能并不是我们预先设计这个系统,把所有的知识都输入进去,而是这个知识库是需要动态更新的,这些问题是我们认为未来在服务机器人瓶颈的一些问题。

那么如何去解决这些瓶颈的问题,我们目前的一个主要思路就是说机器人除了预先训练过的人工智能,因为目前像基于深度学习这些,都是有监督的学习,有大量的数据预先训练出来了,除了这个我们认为必须要有自适应学习,它的感知认知的功能必须在环境中间还可以通过机器人对环境或者对人的观察,或者跟人去交互,就是人也可以提供一些帮助,在这里要有一些自适应的学习,不断把这些功能加强,这样它才能适应真正在服务中间碰到各种各样更复杂的问题。同时它要跟人交互也要结合,就是说当你并不确定或者对某一个物体不认识的时候,可以让人相当于机器人有一个概念就是可以向人学习,人可以对它进行培训,通过这种智能交互向人学习的过程,也可以把它的系统不断的改进。

我们在研究院这边在这些问题上,我们在做一些相关的研究,那就包含了自适应的去识别人或者识别情绪等等,另外这边就是说对自适应的去识别物体,还有三维环境这一块。同时我们最终在这里面也加深了个人知识图谱,在这一块我们希望个人知识图谱可以通过对环境的观察去不断更新的,通过这些我们认为我们可以对下面所提到的一些不确定、不认识的或者缺知识的一些问题,可以在一定程度上进行解决。

下面我对我们在做的技术做一个介绍。这是我们通过一个自适应学习对人进行识别。这是用多种特征,模态的特征去识别,除了人脸,还包括体型的特征。这个系统其实是通过模态间互相的训练,它有一个自适应学习的过程,所展现的效果是这样的。就是说这个机器人刚开始第一天的时候进入家庭,他可能只能用人脸去认人,从侧面或者背后就不认识这个人,过几天它通过对这个人的观察和交互,它慢慢的对人的体型这方面收集更多的特征,这样它能够从侧面和背后把这个人认出来,当然它也有可能会出错。这个时候它要对它的自信度进行一个估计,就是它在不太确信的时候,它还要跟人去做确认,这样的话它这个系统是可以不断的进行学习。就是说过几天或者一周之后,它对这个人的识别就越来越准确。这个好处就是他换了衣服之后,它可以继续学习。目前我们知道通过人的体型特征去认人的一些技术,在视频监控里面也在使用,那个技术就是你换了衣服之后基本都没法用了,它需要重新训练。我们这个系统你换了衣服之后,它还可以继续再学习的。

我们同时也在做一些自适应学习新的物体。因为我们在服务中总会发现一些物体,甚至你这个类别是经过训练的,但是往往因为你的训练量并不是非常够的,世界上的物体是各种各样的,你很难把数据训练得很完全。比如说你碰到了一个药瓶,它没法识别。这样我们通过用户去教这个机器人给它看一下,你要去识别我这个物体,只要对它的第一帧做标注,我们的机器人就可以对物体进行一个分割,并且把它的边缘都准确的分割出来,这就是一个自适应物体的识别。右边这是一个表,我们也在国际顶级的计算机视觉会议的竞赛上也获得了第四的很好的成绩,同时我们也是在看怎么在产品中间能够更好的应用。

知识这一块也是非常重要的,因为我们知道,我们其实在刚才所说的一些应用场景里面,其实牵扯到各方面的知识,比方说物体放在什么地方,你这个人大概什么时候起床,这样一些知识,还有一些常识的知识,还有跟个人相关的知识。我们希望在这个知识库有一个最基础的系统,但它同时又是可以扩展的,就是可以通过对环境的观察,不断的进行更新。而且它这个知识还可以进行一个校验,因为它的知识也可以向用户去学习,但是用户也有可能出错,机器人可以通过对环境的观察和对用户的学习去做一个确认。

我们这边最近也在做的就是把三维环境的理解这一块,环境理解就是我要把三维家庭的环境做一个建模,做一个三维的扫描出来,同时把里面物体间的关系要识别出来,你的桌子、椅子,药瓶是放在桌子上的,把这些关系建立起来。那我们把这些信息,药瓶放在桌子上面这些物体间的关系在知识图谱里面会树立起来,在不同的时候会进行更新。这就是我们的一个演示系统,可以看到在中间这个视频的照片里面,视频里面是我们的实验室,我们做了一个跟家庭环境类似的环境,我们的机器人系统就在这里面转圈,它对周围的环境进行扫描,就有一部分的三维的环境就会出来。同时在里面的物体信息它也在做物体识别,也可以显示出来。同时它可以把这些物体的位置、方位跟物体和物体间的关系,它都可以在知识图谱里面存储起来,所以你可以看到,当然它有些位置的关系并不是那么准确,但是它可以知道你这个药瓶可能是比较靠近桌子附近,你这个书放在跟书柜的位置比较接近,这些信息其实对机器人的服务就很有用。

那我们英特尔这边也是希望把这些很好的技术分享出来,让我们的一些伙伴在这上面接着做更进一步的创新,做最终的服务机器人的产品。所以我们把我们目前的一些初步的结果也分享出来了,我们放在自适应机器人交互库里面,这个库我们也在不断做更新,大家有兴趣的可以先去试用。

我们除了在上面介绍的工作,我们在研究院还有全球的研究院跟这个比较相关在合作的也有一些工作,比如说自适应意图和情绪的这一块,我们也有在研究院的一些工作,那我们有一个组也是在国际的情绪识别的竞赛里面,也两次获得冠军,我们同时在国外的实验室的,也有在环境计算这一块,它就是说在家庭里面或者在环境里面布上一些传感器,这些传感器就可以跟服务机器人结合起来。这些传感器在有些环境机器人是不适合带着摄像头去监控的,比如说像卫生间里面,但是你可能又想了解老人是不是在正常的上厕所,是在上卫生间而不是摔倒了,这个时候是可以在卫生间这样一些地方部署一些传感器,这样环境计算也可以跟服务机器人结合。我们当然也在探索一些落地的应用的原型,可能也是在我们刚才的自适应机器人交互的软件库里面也会放一些这样的应用,在以后会分享出来。

我们再往下就想介绍一下,因为上面讲得比较多的是偏AI的,机器人交互,偏软件这一块,那我们其实在下面这些软件它要有很好的硬件才能去支持。所以我们研究院也在这方面做一些探索,那我们研究院在过去几年也是在把整个的机器人的原型建一些原型做一些测试,这是我们以前做的一些机器人原型。

我这里要特别介绍的就是我们最开始的这一代的服务机器人,就是没有操控的,没有胳膊的机器人英英(音),它刚开始是用平板电脑作为操控平台,后来我们发现它的性能还是不太适合服务机器人,因为服务机器人它的感知认知是比较多的,所以在一个CPU上面是不够的。所以我们其实在第二代的机器人的原型上面,我们就做了一个计算平台的原型,叫Hero平台,就是可异构的可扩展的机器人的开放计算平台。那这个平台它的异构的意思就是说它里面除了CPU之外,还有各种各样的加速器,它可以对深度学习等等进行加速,它会放进去,而且它不只放一个加速器,它可以有好多个加速器一起工作,这样就能够提供很足够的计算性能,同时又保证功耗比较低。

所以这个就是Hero计算平台的优势,它有高度的灵活性,它适合于服务机器人这些,那么它又具有很高的高性能功耗比,就是在同样的功耗下面,它能够提供更高的计算性能,这样既节省功耗,同时又有很强大的计算性能,对于服务机器人这样一个很复杂的系统应用,可以提供一个很强有力的计算平台。另外它还有一些灵活的IO处理,最后它对机器人的安全也有一些考虑,我后面会稍微介绍一下。

这个是我们目前Hero2的一个平台,是目前的实验平台,目前它里面是配置了CPU是英特尔I5或者I7的CPU,加速器可以支持神经计算半这样的一个,它可以插一个计算半,也可以插好几个。这个平台目前在市场上也在对外提供,但是它目前的量还不是特别多,因为它本身有MPGA之后,目前它的价格是比较贵的,目前我们有几十套有些学校已经在用了。

我们再往下其实是希望把这个Hero平台做得成本要更低,像我们刚开始也介绍了,我们更低成本的要低于三四百美元的价格,同时它要提供很好的计算性能。所以再往后你可以看到HeroX的平台,在这里面它是有一个更灵活的配置,就是你的CPU可以选计算性能和功耗更低的一些CPU,或者你是到服务器的这种系列,这一块它可以提供一个通用计算的能力。第二就是加速器这一块,它可以对深度学习的推理进行加速,每一个加速器可以达到一个T,我们这里可以选一片也可以选六片,就等于它的计算性能是不断提高的。另外它还有一个低成本的MPGA,这一块主要是跟安全比较相关的。

这个就可以看一下我们这个HeroX平台,这是它的几种大约的尺寸,它最小的可能跟信用卡差不多,这个在服务机器人的平台里面,如果你要求它的尺寸要非常小,这也是可以的,所以可以看到它的尺寸是非常小的,同时它的计算性能上面,可以看到我们右边这里最高的就是说它是从1到8T的计算性能,同时它的功耗又非常低,所以整个平台就只有几十瓦的功率。另外它的低成本的版本是小于400美元的,所以它的成本也比较低,同时尺寸各方面都非常有竞争力。

这一个就是在这样一个异构的计算平台上面,英特尔这边也提供了叫OpenVINO,就是CPU的集成的CPU上可以跑,还可以在MPGA上面可以跑,就等于你做一遍的编程可以在不同的架构上面去进行加速。如果你是一个很复杂的系统,你可以把不同的算法根据自己的需要灵活的调配到不同的部件上面去进行加速。

最后再讲一下我们这个上面也有MPGA,可以把它IO方面都可以保护起来,这样你从摄象头进来的数据就不会被恶意的篡改,因为你被篡改了之后,可能会影响系统的安全性。另外它同时还有一些重要的功能,它也可以用MPGA或者在硬件上面去进行保护,这样它可以保证机器人即使操作系统被篡改的情况下,它不会做一些危险的动作,比如说去撞人或者它的胳膊去碰人,这是我们在安全性方面把它的性能进一步提高。

最后做一个总结,我们在英特尔中国研究院这边也在致力于突破服务机器人的技术瓶颈方面做一些研究,助力下一代服务机器人的研发,同时我们Hero计算平台是一个可扩展的高性能功耗比的安全的计算平台。所以这些技术我们肯定是只解决了其中部分的问题,我们还要跟企业界、学术界更多的进行交流和合作,那么最后去探索怎么把我们的这项技术去落地,去为服务机器人行业,去做出一些很重要的一些产品。

主持人:非常感谢张总精彩的报告,张总带领这个团队时间很短,就是最近几年,进展得非常快,做得非常好,而且能够为中国的研发成员提供一些平台的支撑,感谢张总。

下面一位演讲嘉宾是来自百度的黄新宇博士,他是摆渡机器人和自动驾驶实验室资深研发工程师和美国北卡罗来纳中央大学终身副教授。他的研究领域包括机器人视觉、图象处理、机器学习等等,取得了一系列的成果,下面我们用热烈的掌声欢迎黄博士的报告。

黄新宇:大家下午好!非常荣幸有这么一个非常好的机会,向大家作一个汇报。首先我介绍一下我们实验室的名字,叫做机器人和自动驾驶实验室,它是百度研究院底下的一个实验室,百度研究院底下有好多实验室,有我们这个实验室还有大数据实验室等等,我们是其中之一。那今天这个汇报我主要是想汇报一下我们实验室在过去一年中做的一些工作,向大家汇报一下。我们这个实验室的领导者是杨瑞刚(音)教授。

在介绍我们实验室的工作之前,我先把大背景说一下,大家都知道百度是一个大的搜索引擎公司,最近几年也在做转型,完全转到了一个人工智能的公司。举一个例子,我们是在百度研究院,我们这个事业部叫做人工智能事业部,我们有一个非常庞大的百度大脑的人工智能平台,这个平台大家可以看到,它有很多不同的功能,全都是对外开放方面的,所有的功能比如语音识别、图象识别、增强现实等等这种功能,这是一个大的框架。今天我有可能只能讲一些我们实验室做的工作。

在介绍我们工作之前,因为我们这个实验室叫做自动驾驶和机器人实验室,那我们肯定就要谈一下百度的自动驾驶,百度的自动驾驶它会有一个很大的平台叫做阿波罗的开放平台,这个平台它现在有这么一个四层结构,最底层是一个硬件结构,就是推荐你可以用什么样的车辆,认证的车辆,上一层是一个硬件的平台,例如它的GPS、相机平台,再上一层是它的软件平台,有软件系统、感知系统、路径规划系统和最后的控制系统。其实我今天讲的主题有可能会围绕我们的工作在感知系统和路径规划系统这两块,这是我们的两大重点。再上一层是云端服务层,大家可以看到有高精地图、仿真,仿真也是我们的一个重要方向,所以今天我们会围绕着这几个方向讲一下我们的工作。最后一个是对百度本身很庞大的语音识别系统,它有可能甚至是比阿波罗更大的平台,是提供车载的一些语音识别的功能。这是一个大背景。

这一张主要是讲一些阿波罗的项目已经做了一些什么工作,它基本上创造了一个中国的速度,2017年4月份正式发布,到2017年9月,阿波罗1.5版发布的时候,已经具备了在固定车道驾驶的能力,到今年1月份的时候,也能在简单路段上驾驶的能力,到今年7月份有一个阿波罗3.0的发布,已经实现了世界上第一个L4。它有不同级别的驾驶级别,L3它主要指在高速场景的驾驶,L4是在城市场景的智能驾驶的能力,实际上到今年7月份已经有了批量的生产的世界上第一辆小巴士,我也听说有部分出口到日本。它的合作方有一个很强的生态系统,这是它的合作单位,包括今年跟沃尔沃、宝马的合作,这是阿波罗整体的大环境。

我讲一下我们的工作,我们的工作并不是自动驾驶事业部,我们是自动驾驶和机器人实验室,下面我们介绍一下我们的工作。我们第一个工作做了一个数据集叫阿波罗数据集,但是这个数据集会比较敏感,实际上在业界公开的数据集里面,我们知道来自于德国的××这个数据集是比较大的,来自于德国奔驰和的数据集也是比较大的。我们今年发布了一套街景的数据集,我们发布了14万张,未来会发布20万张的街景的像素级别的数据集。那么我们做了什么工作呢?我们这边采集了很多数据,然后我们有这种像素级别的标注,我们现在又在装立体视觉利于稀有场景的采集。我们知道自动驾驶当你采集了很多数据之后,实际上有些数据比较重复,有些数据比较稀有,比如说突然刹车了,我们也是跟北京的首汽约车合作,把立体相机的系统装到这些车上,我们会抓取一定时间长的数据传到云端,这是现在正在做的一项工作。

基于这个数据集,我们还会做移动物体的轨迹,就是很稠密的移动物体的轨迹。包含用户驾驶行为和行走行为的一些分析,这是我们整个的一个计划,有些已经完成了。这是我们的多传感器的采集车,我们是把很多传感器都融在一块的一辆采集车,所以稍微独特一点,目前也是为了把所有的数据都获取到,供研究人员去研究什么样的数据更有用。比如说一辆车它的点可能在检测和分割上可能不太好,一般的IGB的相机在多传感器如何融合的一个供科研人员整体研究的一个数据集的发布。

下面大家可以看到一些例子,我们这张图实际上我们叫它像素级别的标注,大家可以看到每一个物体都可以标注成一个颜色,底下是一个深度图片。那我们这个数据集相对于国外采集的数据集还有一个特点,它是一个高复杂度,高复杂场景,比如说在北京五道口还有很多地方采集的数据,平均每张图有十几辆车,大概有100多辆车,所以在中国这种场景是非常高度复杂的场景下生成的图是非常有意义的。还有道路线的,根据道路线的颜色、它的功能归纳出不同的道路线,这也是用作道路线的识别的一些用法。然后我们有三维的轨迹线,包括动态物体、行人和街景的轨迹线,以及三维车辆模型弥合出来的模型。

这是我们做的一个数据集,我们现在看看这个数据集能干什么,我们提供了一些应用,当然我们也是希望有更多的科研人员和工业人员,其实这个数据集今年7月份开放了,全球各个大学和研究机构,欧洲的、美国的、中国的都在下载和使用,我们每天也是会接收到很多咨询的邮件。我们也做了一些尝试,就是展示我们可以干什么。一种是作为一个仿真的系统,我们有阿罗波高精的点位的图,我们也有海量的CAD的模型,我们把它融合起来,形成一个鸟瞰图,这个鸟瞰图上面可以生成我们想要的东西和场景,就是有一些场景可能比较难,感知上面模块上会在这种场景上出错,那我们可以生成我们的东西。但是这个生成的东西不能直接用,因为这些模型太精细,真实的采集车抓到的图是这样的,这是一款激光雷达扫描仪采集的,它采集的是这样一个效果,激光扫描它碰到透明的东西像玻璃会穿透,碰到不同的材料会产生反射,我们生成的数据并不能直接用,那我们怎么把它转换,这里面也用了大量的技术,用物理建模等等很多方式。我们做的东西要真的在自动驾驶上的实际场景上应用,我们看我们的训练效果能达到什么,我们现在做到几乎可以抛开真实数据了,下一步还会进一步的提升生成数据的精度。这是刚才说的一个应用。

第二部分是我们这个实验室另外一个大的方向是仿真,仿真的一个主要目的也是为了解决稀有场景的不足,因为很难获取到稀有场景,我们有时候能够通过仿真数据来获得稀有场景。仿真也是分了两大方向,一是增强仿真,是一种在感知领域上的仿真。第二种仿真主要是指用户行为的仿真,那我先讲讲增强现实的仿真。这个想法其实就是说整体的想法是把这个场景分景的思路,首先我们有语义分割的效果了,我们就知道哪个是车,哪个是行人,哪个是背景,那我们先把车、人提出来,我们形成干净的背景。这里面我们用到了各种算法,这些算法其实也都是一些深度学习的算法,都是业界有很好的研究的算法,也是很火的,今年也都是很流行的一些研究方向。我们最大的一个特点就是会基于时序上来做仿真,都能保证它的原样,这会有一些基于数据上的不同,所以我们会拿到非常好的干净的背景,然后我们再把车放回去渲染,生成非常好的效果,这样的话我们可以操作这个车。这是一种在视觉上增强现实的仿真,在这样的情况下,我们生成不同视角,原先采集车没有采集过的视角,原先采集车没有看到过的车辆的组合。

第二个实际上就是用户行为模型的建模或者说仿真。最大的目的就是我们想模拟这种不同的路段,不同的物体,车也好、人也好,不同的这种运动物体怎么在这个地方动,这一块我们可以看一个,这个是行人,实际上它是有一段采集录像,它是用监控录像我们采集到了某一段路,我们学习那段人和车行程的轨迹。这是在交叉路口,这个视频录像也是在北京采的,所以我们也能看到大家比较常见的一些运动的,在交叉路口我们行人和车互动的一种模式。

这是运动行为,人和车的运动行为的一个数据驱动模型。那我们还做了一些定位的工作,那我们实际上已经有了语义的地图了,我们三维的二维的都有了,三维的是每个点都有了语义信息,二维的是每个像素都有了语义信息,那这些信息比较有用,我们怎么用这些信息来进一步的在车辆行驶的过程中帮助它做定位、分割和场景的理解,这里也是一个大的图片。我们整体是想利用到三维的地图我们来判断当前车辆具体的姿态,通过这个姿态最后去做像素级别的分割。

刚才是一个智能驾驶的工作,我们发布了一系列的应用,来服务于不同的我们自己的感知功能的应用,像感知仿真,也提供了更多的用这些数据集的方法。

我们另外的一个方向是机器人,我们看看去年我们在机器人方面做了什么工作。我们首先注意到MIT在2017年发布了一个非常酷炫的Demo,我们的目的还是让它穿越人群,MIT2017年的文章还是不错地,但是它的场景人比较少,它就一个人或者两个人,顶多三个人,它的场景有限。我们比较感兴趣的是这种场景,这是我们的自动驾驶场景,在这种场景,比如说你在一个超市里面,你要穿越超市,你真的会碰到几百个人,但是现有技术能不能行,我们想研究这个问题。其实它的现有技术也是增强学习的模式,增强学习也是用在像阿尔法狗下围棋的一个算法。那我们是基于增强学习做,我们首先也建立了仿真器,我们通过在仿真里面去学习避障的功能和策略,学好之后我们再把它转移到真实世界的集成,这是我们做的第一版的小机器人,专门来测试能不能穿越人群的一个小机器人的实验。那么这个小食品是这样的,我们在百度科技园底下一层是一个食堂,百度科技园有上万名的员工中午都会在食堂吃,我们把这个机器人放在食堂的一边,让它走到另外一边,其实很多人很好奇,它是故意的想挡住机器人,这个机器人有两个特点,它会迷失自己,它不知道它在哪,或者是它会定住不动了,如果纯靠MIT的算法的话,这两种情况出现的概率会非常大。然后我们用了混合学习再加上一些其他的技术,我们能够把机器人迷失的问题降到非常小。这是另外一个应用场景follow me,也是验证我们这个平台可以适用于室内室外以及不同的平台,这是一个室内的场景,二是室外的场景,三是菜市场,最后一个机器人应该是我们从CMU买的小机器人,我们把我们的算法移过来,不同的平台也是可以工作的。

其实我们还有一些近期在开展的工作,主要是我对那些方向也不是非常了解,比如说无人挖掘机的项目,百度挖掘机的项目,我们组也有很多人在做这个项目,也是非常有意思,非常具有挑战性的项目。那我最后给大家介绍一下我们的网页,阿波罗网页是整个百度智能驾驶的平台的网页,我们提供了像素语义级和实力级的标注,道路线的标注,所有的标注全都提供了,有20万帧的一个东西,我们实验室的网页。我们今年也举办了一个研讨会,和CVPR是一个国际级的研讨会,在那个研讨会上我们也邀请了各个领域的科学家一块讨论自动驾驶的技术,目的也是基于阿波罗Scape开发了很多赛题,让他们去参赛,实际上也是来自于世界各地,各个方面的一些各大公司都参加了这些竞赛。

这是我今天所有想讲的内容,谢谢大家!

主持人:感谢黄博士,百度的无人车和机器人的科研工作是在国内甚至国际上都受到很多的关注,今天我们也通过黄教授的报告,我们有更多的了解,而且其中很多内容重点是人工智能的,这也让我们了解人工智能和机器人现在融合的趋势,再次感谢!下面我们非常荣幸,今天压轴报告是孙立宁教授,孙立宁苏州大学特聘教授、苏州大学机电工程学院院长、博士生导师、国家杰出青年基金获得者、教育部长江学者特聘教授,国家万人计划领军人才,国家863计划专家,目前还担任国家科技部服务机器人重点专项课题组专家。孙教授主要从事纳米机器人、微驱动机器人、微操作机器人、工业机器人、应用机器人等方面取得了很多突出的成就。今天孙教授也从很远的地方赶到我们的会场,让我们热烈掌声来欢迎孙教授的报告。

孙立宁:报告讲的是用机器人的题目,后来看到大的题目又加了特种和服务,就临时改了,我想从另一个角度分享一下在当前机器人的发展,尤其是在服务跟特种机器人的发展能不能换个思路,大家的网太多了,机器人无所不在,但是细想当前的一些创新,还制约了很多东西,我想从另外一个角度。大家说智能时代的到来,显然大家是智能制造,智能制造是什么?就是智能装备加互联网加人工智能。那么从智能生活来看,这是非常广阔的空间,衣食住行从智慧、交通、农业、家居和健康,这就产生了以这些为代表的智能产品也同样在传感器的作用下,通过互联网和人工智能就产生了这种技术创新、产品创新和产业创新,这个大的思路,就是说学科为什么做到这一步,过去到现在几十年了,为什么还没有到现在这么热,因为我们有人工智能的发展,互联网打通了,大数据来了,这时候需求也到了,到了一个非常好的时候。人工智能技术的发展也经过了六十年,由于计算机计算能力的出现,硬件和应用的出现,那么人工智能更能走向一个高端,从学科交叉促进了这个大的发展。从工业机器人的发展也同样没有完结,它仍然存在很多新的发展趋势,像高性能,重载轻量、精密、移动操作、人机协作加上智能互联网的智能机器人。那么智能的发展基于视觉和传感器环境下的这种应用还有很多技术要进行突破。那么从智能机器人来看,从孩子到我们家庭生活,到我们老年跟我们的从生到老的过程中,成为了我们的伙伴,这个故事好讲,但是这个场景不好用,而且从应用和商业模式上也不好说,它面临着很多的问题。从我们的健康来看也发生了巨大的改变,而且把人工机器人技术、微纳米技术、3D技术和人工智能交叉融合,产生了智能化、精准、个性化和网络化的模式。从我们看病到微创到远程到康复到穿戴市到健康,以及通过大数据跟人工智能技术改变我们健康的方式。

还有从交叉来看,云的出现促进了机器人的发展,像手机一样,让机器人成为可能,分享人工智能的成果,使得机器人更便宜、更智能。举个例子来看就是交叉促进了机器人的发展,因为机器人学科本身就是一个多学科交叉的产物。那么举几个例子分享一下,首先大的跨越,我们跟纳米技术结合,跟生命技术科学结合,看看能不能产生一些创新。我本人的实践,读博士生的时候老师就让我做纳米机器人,那时候纳米还不懂,经过三十年现在看纳米机器人方向比较火了,从这几年深圳的基金,从2018的科技项目指南,2019还有,包括小机器人。医疗机器人我们用于生命科学的自动化装备和健康装备应用机制,那么利用生命科学的原理,来提升我们机器人的这种水平和出现了仿生机器人,这三点结合就是微型机器人,用于血管和肠道的机器人。

从医用来看,国家和国际上把健康都作为很重要的发展方向,从2016、2017、2018到科技部各个部门,把医用机器人做了非常大的一个投入,主动健康、康复,包括2019的指南有八项跟医用机器人有关,说明这个时候到了。以达芬奇为例,这一个手术机器人就能够实现医生的远程操作,不用开膛破肚,能够远程,一台一开始卖3000万,现在2000多万,全世界卖了4000台,4000个医院上百万的患者使用,这就是高技术、高投入与生命科学相结合的装备。

包括外骨骼,包括假肢,更重要的是老年的孤独,这个怎么解决,包括老年在家庭的一些照应,这种需求更为高级,这种创意和使用性能更强调。再高端的发展人工心脏,我们苏大的老师研究出来了,磁悬浮,给三个活人干上已经活了半年,这个经过十年的发展,它也是机器人的概念。我们在863里面首先立项的药丸子,现在大家都知道,代替了进口,吃一个药丸就能把肠道的参数,包括定点的药物释放。还有目前在发展的进入血管的机器人,甚至进入细胞里的机器人,所以医用的需求拉动了医用机器人的发展,这也是交叉而产生的方向。

那么仿生机器人属不属于特种呢?不好说,我看报告里有的专家单独讲,肯定讲得很好。这是在2013年的时候,我在哈工大重点实验室总结了一下哈工大的成果,梳理之后发现,机构仿生、功能仿生、表面仿生、感知仿生、智能仿生。机构仿生容易理解,就是大狗,各种各样的动物形象上。还有功能仿生,就是假手和假肢,它从结构上、功能上代替人的工作。再比如我们的水米、水上漂,几十毫克就能飞起来,那就是它表面有荷花这种微结构,微纳米毛,它实现了疏水的功能。那么还有我们人的感知,就不用说了,最后像人一样的智能,是不是未来的发展方向。这些问题就产生了我们在学术和技术上,像大狗最核心的技术高能量密度去驱动,这个很重要,什么样的机构。二是像功能仿生,形态、结构、功能仿生集成。接下来基于生物学原理,生物里面我们说声波,我们所能听到的声音就是这么多,狗的鼻子就是比我们的好使,蝙蝠的感觉比我们的强,生物学很多原理给我们启发,包括他们局部的智能控制比人类还强,像猎豹的运动控制比人类还丰富。这个就不放了,大狗的问题,还包括双轮驱动的问题,实际上这三个例子我认为它是仿生机器人发展的一个很我的阶段。从机构学来看,它是一个很高级的阶段。

从人工智能的角度,也是代表着高端的研究成果,它有动态的特性,对环境的感知以及对自己姿态环境的理解,我觉得这个是非常高端的。那么实际我本人和团队十几年前也做了点研究,一直没讲,这段时间人工智能火了,我们就翻了翻PPT。这是2004年前后,我的博士生们讨论这件事情,那个时候我们认为仿生的控制问题除了机构驱动之外,当时我们提了一个概念,就是人要从这个楼梯走下去的时候,可能摔倒的一瞬间大脑没有反应,而是条件反射,后来从这个启发,我们从下而上研究这种控制问题。

比如人类智能的进化由单细胞发展到多细胞、复杂多细胞,细菌这种生物是很简单的,实际上运动也是一样,从简单的运动到复杂的运动,智能的发展就实现了思维、逻辑、心理、情绪这种从低级智能到高级智能的发展历程,当然我们的生命科学的认识,对低级生物的认识还是未知数。那么基于这样的原理,我们想从神经元基本的模型入手,看看这是什么东西,然后从这样一个网络路线图,我们来研究信号的处理、观景的控制、然后神经元的置换,起码做到这一部,再往前发展就是宏观的复杂系统,单腿的控制、多腿的控制,最后达到达到大狗的控制,在2004年就提出来这样的想法。这样的想法我想它的思维的技术是什么,是生物学原理。生物学原理我们不懂,是一个偶然的现象我们进入了这个领域。比如说生物界的低端生物,基本上都是由神经元,神经元基本上就有三个细胞,细胞里面有细胞膜、细胞壁,里面有细胞质,细胞之间是通过神经的轴突进行传送,传送的离子就是生物电信号,生物电信号控制着生物的运动。在几百年前生物学就发现了这个原理,三个细胞之间时时刻刻是有电位的出现,电位是振动的它不停。通过相位的变化,实际上如果没有受到外界的刺激,相位的变化四个信号的时候就是零,那么肌肉就不动了;当受到这个干扰的时候,生物电的相位发生了变化,然后网络实现了控制,这个生物界已经存在,但是没有模型。我们学习了生物学之后就发现了在细胞里面的,细胞膜、细胞质这个离子,包括里面这个门,细胞的通道,这些问题会等效同物理模型,等效同机械模型,我们当时并没有理论指导,所以用了常规的机械系统动力学的模型,质量、阻尼、刚度来等效细胞相关的膜、离子和轴突,做了这么一个理论。突然发现了这里面的振动波形和生物电模型完全耦合,这是一个偶然的现象,从这儿开始我们进入了深度的研究。

研究的结果就发现很有意思,网络的模型我们建好以后,我们把水蛭神经切断,我们自己做了一个硬件电路,这个硬件电路就是一个转换口,从这边的信号通过进到这个电路,然后又利用这个模型再输送给水蛭,把这个接上,接上的结果还挺好,水蛭还能运动,这就告诉我们这个模型对了。用这种控制方法很有好处,比如说在打磨、振荡,这些数据的抛光的这些点的理论模型和我们的实验结果非常吻合,但是这里面还是没有理论基础,是实践和实验得到了,所以在当时突破的理论上很困扰,后来逐渐更深入。我们做这个的目的还是用机械的控制,比方说用两个神经元,这就发现生物界还有一个现象叫互异的,什么叫互异,它俩是互相导通、互相耦合,也就是说没有受到外部刺激,它是零,从这里的信号来看发现确实是呼应,这个振荡这个不振荡,周期还是一样的,这是静态的。如果用这个原理,我们实现机械打磨力和位置跟踪的时候,就会发现连续曲线的变化和力的变化仍然存在呼应,这种呼应的节点就没有通过采集,它直接利用网络直接来控制,直接同步,这就有点像条件反射这样的原理。

我们再复杂一下,用三个神经元,这个就比较复杂了。三个神经元以后,利用我们过去的现有的CPG模型,那CPG用了好多年,它的理论基础还是来自于生物界的神经元,但是并没有解释为什么,这种构架应用了仿生,但是为什么没有解答。如果把我们前面做的模型嵌到我们的CPG里面来,两个互异的,这就不一样了,对这个机器人腿四个自由度以上的运动就不用上位进行控制了,就可以通过这个模型直接控制。这个连续拿了几个国家基金,取得了一定的成果,我想如果能够继续完善,是不是对控制器的改变有很大的变化。所以我们搞机械的也是在神经科学一些杂志上发表文章,这是学生为了得人才,所以自己想了一下,那就说明在学术界里面搞一些创新还是必要的。

跟纳米技术的结合也给了我们一个重大的空间,人类认识世界就在每的量级,在我们看天的时候,仰望星空看不到头,所以空间很大。再往里走走不到头,人类在认识世界和改造世界的时候需要工具,这种工具就是纳米机器人。所以在讲机器人科普的时候,就认为机器人最终的目标是进入血管。但是从人们对生命科学的应用来看,提出了靶向治疗,这肯定是对的,你吃一片药治了一个细胞,但是你还是浪费全身的影响,靶向肯定是方向。但是从药物学的发展,怎么送、怎么动,这个高效率的发展还得需要设备,所以机器人这边配合,产生了SAM、操控、系统,最终能够进入血管和细胞的这种机器人,纳米机器人的发展是这么一个故事产生的背景。

接下来我们来看纳米制造,纳米制造我们看有的电子电路大量的都是光刻批量,这还不算,未来的发展是三维的,对局部的操控、修复和控制还得用装备来实现,这个从未来发展来看是一个很大的发展方向。回头看具体应用,现在看目标输送、外科手术、生物传感,把人的细胞放到传感器上,它来感知,但是如果把细胞控制在传感器上,这里面就要操作。当然使用药物就能够对我们的脑血栓的清除,这个故事也讲了40多年,现在看的确人们还在追求。比方说纳米操控,我们宏观抓一个手,那是我们的机械手,但如果抓一个原子怎么抓,肯定就不是手的概念,这里面肯定也很难。所以在这里面的难题,就是在微观环境纳观环境下,我们所看到的重量和质量不重要了,是惯性和黏附是它主要的力,就像在操控一个手带了油,抓个带油的物体,永远是黏的过程。在这种作用下产生的运动问题,就是纳米的,那就存在纳米的跨尺度的定位问题。然后这里面什么样的机构能实现纳米呢,突破了传统的理论,无间隙、无摩擦。然后接下来看能看得着,三维大面积的还能够定点纳米级的检测,基于微纳尺度的三维成像问题露出来,这些问题也给我们科学上带来了很多挑战,我本人从1990年开始做到现在,也回想起来从驱动然后做应用,然后做封装,到2007年开展纳米操作。

从机构学来,我们过去所有的机构都有间隙,这是必须的。但是现在我们发明了这里面的机构全是弹性的,用内部的感知实现闭环,就实现了纳米控制,很简单的机构。那么为了把微驱动跟机芯连起来,多自由的运动,我们把并联机构就变成了纳米多自由的机构,这也很巧妙,这个机构里面的微动并联机构,它这里面的宏观存在很大的不同。这个运动很小,毫米级运动,这个结构也很巧妙。那就是说在这个微动机构,大的柔性铰链代替了我们的轴承和关节,这里面实际上是微驱动,这底座是宏驱动,宏微结构一体化,实现几十毫米的运动,分辨率达到纳米,这里面对光的制造、生物等等都有很好的要求。

接下来我们做宏定位,宏定位也很有意思,我们就利用陶瓷的惯性仿生原理,没有导轨。为了发挥它的出力,我们在表面上刻了很多微结构,也就是说它的静摩擦很大,动摩擦很小,所以它惯性的力就很大,这时候我们的速度出力全部增加,而且力也增加,重复性也很好,这就是未来在纳米定位的时候一些新的机构。

我们这七八年也跟国外很多单位合作,跟南开大学合作了十几年,最终的结果我们抓细胞,切出来做克隆、生殖、分析,用机械手抓细胞,吸上还别抓坏,还能看到半透明,用偏正光来成像,这跟一般的显微镜还不一样。最后在2017年的时候,南开大学的赵新教授,春节前后克隆出16个小猪活了,这就是克隆技术的发展,用这种微操作我们做定位,获得了国家的十大成果进展。还有我们在这里面做SEM,SEM是电子扫描显微镜,里面用了四个机械手非常小,我们能够对碳纳米管能够原位进行电测量,也就是我们上中学的时候拿两个电压表测电阻。上次给上海一个院士一个新的纳米材料,这个纳米材料很有意思,它拉伸能够是原来长度的六倍的弹性,那么怎么能够把这个材料抓住,能测出来,人是看不到的,这就是测量、定位一体化。

还有我们做了一些研究是平面的,平面研究我们做的是这样的研究,一维对微结构进行推拉切这样的动作,后来我们做了三维,这就很庞大了。这是一个小球,40纳米,这个机械手放在这边,那个机械手怎么找到它,它并不是视觉,是摸出来的,怎么摸?动态的进行扫描,扫描到这个针在什么地方,球在什么地方,最后它俩形成个镊子,这个镊子形成的时候能抓40纳米和10微米,而且能够操作这个碳纳米管,三维的,这个也花了大概十几年的时间。再接下来我们看微型的机器人,微型的概念并不是说很广义的概念,过去说纳米微型、平米微型,结果说足球那么大叫微微型,苹果那么大叫皮微型,所以相对的比较。所以对于机器人来讲什么叫小,什么叫微,比如说过去的机器人有齿轮进入肠道,我们十个毫米,那么我们这里面很简单就几块钱的东西,就是我们音乐盒里面的陶瓷片粘到了三个腿上,三个腿一振就跑了,这叫振动原理,非常简捷,而且跑得很快,每秒钟200毫米,能量很低,因为Q值很大,大概240毫安。这个干吗用呢?完全外面搞一个无线就能够控制了。当时记得国外谈到了特种机器人叫纳米灰尘的概念,用于战场用的。最终目标可能做到肠道,这个肠道也很有意思,这里的鞭毛是振的,就跑了,但是它的使用还很远,这就是微的概念。

前段时间在《光明日报》发表了中国科大香港城市大学和苏州大学团队研究出一台金属,一台金属就是什么呢,实际上我们金属在常温下是液态的,它能形成微米到毫米级的小球,这个小球有一个道理是半绝缘,通过极化两边产生电荷,电荷就保留在小球上。那好了,如果你做一个网格状的三级,通过电级的变化是动的,很简单没有机构。这个很有意思,它里面放了八个小球,然后放个小电路板,这就是体现了一台金属的控制问题。当然科学层面上问题有很多,技术层面上也很多。后来我们的想法进入到微型的环境,外部用磁铁运动,它就跟着跑了,那么你进入这个管道,它并不知道这个管道的形状怎么走,外部用磁场或者电场诱导它去走就可以了,这是在微型机器人的发展方向。

还有哈工大机器人重点实验室李教授他们用化学的办法,未来机器人的发展概念是多学科,不是我们想象一定做出来一个机械,不是的,它用化学腐蚀的方法加工出这样的机器人,能动,直径是100纳米,而且它通过动不能加电,它没有电池,用红外光一照就跑了,或者是磁、或者是电场,这就是一些小的方向。还有一些特种机器人,比如说精子天生就往卵子上跑,还有一些病菌和细菌,就天生的就抓白细胞,这是生物学进化几亿年的历史。那就用这种活体,把我们的机器人传感器放在一起,那它走带着机器人做就行了,这也是个办法,也是个生命符合的道理。这个办法可以批量,比方说做一些微结构,细胞或者精子的活体注入,它就可以一个一个找出来,找出来以后就批量化进去。

还有我们注意到未来的发展它怎么外部控制,靶向的控制,这几个图片也挺有意思,仿生的运动,这个群,这些细菌一样的小机器人可以从外部的磁场出现群的控制,细胞的轨迹就可以操控。到了这个细胞以后就能够去释放,定点释放,这个技术也很有意思,包括也能自主导航,轨迹跟踪、自主导航。

从另一个角度来说,大的发展是服务机器人是刚性需求,充分利用人工智能技术、互联网技术、大数据技术,这是对当前一个很重要的问题。但是从产业的角度,像我们的部件怎么能够好用便宜,服务阶层能够用上,这两点如果结合不好,这个产业也很困难。另外从机械发展的趋势,智能化是重要的环节,智能化的问题目前也受到了瓶颈,理想很大的目标,但是具体用到我们的生活中来还有很多的困难。所以要明确边界条件,越具体、场景越单一,这个机器人可能更好,不要指望它什么都能干。再一个从学科角度,利用生命科学、纳米技术的一些方法,来拓宽我们新方向的产生,对高校里面的创新还是有帮助的。

谢谢大家!

主持人:我们今天演讲的环节就结束了,几位嘉宾都是机器人领域的大咖,机会非常难得,不能让他们讲讲就放走了,下面我们有一个圆桌对话,我先简单说,因为对话分成三个阶段,其中第一个阶段还是台上的嘉宾做一些更开放的阐述,然后第二个阶段是提问,提问可以嘉宾互相提问,也可以台下的听众也可以提问,这是非常难得的机会,平时要找这些大咖还不太容易,今天有这个机会大家可以准备你们的问题,到第三个阶段,我们再请这几位演讲嘉宾和对话嘉宾再做一些总结和展望。

在我们的圆桌对话里,我们把我们话题范围放宽,不仅是技术,从技术的角度也看我们的产业。那2018年基本上过去了,但是我们都知道2018年是非常特殊的一年,可能在过去好十几年里,到2018年是非常非常特殊的,国内外都发生了好多事情,机器人产业发展得也非常快,但是也出现了新的情况,包括今天上午曲总也对整个2018年和过去三年中国机器人产业发展的状况有一个很全面的总结,有一个很有说服力的一些数字。下面请我们今天在台上就座的五位嘉宾,分别从各自的角度出发,对2018年以及过去几年整个中国甚至世界的机器人产业的发展,技术对产业发展的推动状况等等,我们第一个阶段是谈状况,也包括了问题或者哪些技术,现在可能是比较成熟的,希望比较大的,还有可能哪些技术现在可能还是缺口比较大等等。另外也可以从产业的角度,现在产业发展了,比如说杨总是来自企业的,机器人产业出现什么情况,因为上午曲总还是从宏观整个的,我们在座的几位专家可以从微观的角度,从各自的领域也跟各位分享一下,我们对这个形势的判断,这是第一个阶段主要的话题。

第二个阶段就是台上的嘉宾还有台下就座的来宾,我们可以提问,台上也可以互相提问,因为报告了这么多技术方面的进展等等,有什么问题我们可以第二个阶段交流,我们第三个阶段怎么解决问题,进一步未来怎么发展,到2019年以及未来三年,我们会遇到什么问题,我们应采取什么措施等等,今天就是分三个阶段。第一个阶段就是回顾过去三年,特别是今年2018年,首先请孙院长。

孙立宁:第一个话题回顾,回顾2018,应该从中国大的产业布局还是比较稳步的发展,因为中国机器人大的布局从南到北还是很庞大的,还有从苏州、南京、浙江一直到安徽,而且近期“一带一路”,西安地区发展得很快,今天在山东,山东的排名也比较高,从布局看稳健发展。但是从工业机器人的发展,应该从本体制造商基本能够满足部分需求,能够更多的围绕2025的实施进入到转型升级。这个大家能看到了,而且从去年科技部立项的几个项目听了一下,工业机器人进入到大型高等制造装备。从服务机器人来看,我觉得今年在2018在×××上市,就说明以扫地机为代表的机器人已经有量了。而且从特种机器人来看,它刚性需要,你还注意到像中汽重工在消防这种量很大,也在山东、徐州等地有很大的发展,在特种这一块也有进步。通过另一个角度来看服务机器人的发展,这个东西无所不在,从应用来看一定刚性是第一位的,什么叫刚性,就是你一定有用,扫地能干活,教育孩子提高学习,对老年人的照顾肯定是有用的,从这一点的选题上非常关键。所以从去年来看,凡是刚性需求的产业持续比较好,像特种、教育机器人、医用机器人等等,这个发展很好。但是从另一个模式来看,我们的瓶颈好像似乎稳健一些,这是对的,因为从前三年在中国的布局人们热血沸腾,但是到后面就爬坡了,而且恰恰人工智能在去年和前年更热,某种意义上压了一下,这是对的,太热不好。

我思考几个存在的问题,一是需求上一定要刚性,很多的选择没有细分,完全从自己的兴趣出发,认知上得不到认可。

第二,从技术本身,我们在产业链方面还不太完备,包括基础部件、成本问题,这是制约了我们批量化的问题。

再一个人工智能的发展有进步,有未来的前瞻性,但是真正跟机器人的结合解决实际问题还是需要时间。我觉得2018年是稳健平稳的过程,是一个人们思考再创新与应用的理性的过程,而且在产业集成应用方面取得了巨大的进步,但是在未来还需要完备产业链和创新链。

主持人:孙院长的意见就是2018年可能增速有所下降,但是它是有它客观的必然性,实际上还是稳健的。就是在复杂的情况下,有各种不利因素的情况下,仍然在增长,这也是一个非常正常的情况。

黄新宇:大家好!我主要是来自百度的工程师,我主要是说一说我工作在百度的这一年,主要是自动驾驶,自动驾驶也是机器人的一个分支,毕竟是一个在路上跑的物体,我觉得这一块会有一些什么问题。我觉得自动驾驶的落地比如说在受限场景、在无人园区,在一些仓库的话还是有很大的落地可能,也有很多公司在朝着这个方向去做,真正朝向向L4的自动驾驶未来还是非常遥远的。特别是像在交通很繁忙的地段,像北京的五道口这样的,行人在过马路的时候,不一定红灯我就一定停,那你的车是过还是不过,如果你的车停在那儿,你有可能永远过不了马路,这样的话也是比较难的。再就是有一些意外的情况,有一些很罕见的情况,在这种深度学习的情况下不太容易碰得上,比如说我这个时候停了,开了车门,这时候我不知道车上会不会下人,那我应该做什么样的一个反应,我的一个正常的反应应该是什么。其实像有一些问题它是能够通过深度学习的一些机器学习的方式去做,例如像刚才说的开车门的情况,人类正常的反应有可能就会存在我如果这个车门开了,我也不知道有没有人下来。但是对面假设有一个车过来,有可能我会方向盘稍微打一点点,我绕过去,如果发现对面有车过来或者旁边有另外一辆车,那就有可能会减速,因为我不知道会不会有人从车上下来。实际上这些行为我发现也能够靠深度学习学出来,但是还是不够的。如果针对未来有这样的城市级别的L4的自动驾驶的话,这样开发出来的车我们是不敢坐的,肯定难度还是有的。二是光靠深度学习还是不够的,还要混合一些规则,这是我在这个领域这段时间内的一些认识。

主持人:大家有问题等会儿还可以提,比如说现在做无人车的全球范围有很多机构在做了,百度在什么位置,请黄博士准备,可能一会儿有人会问你。

张益民:我这边比较关注,正好我们的研究也是在服务机器人这一块,我们公司还有一个部门也在建立跟机器人相关的一些生态系统,包括上下游的一些厂商。从我们看到整个过去的一年,我也感觉整个的发展还是比较稳定的,在中间我们刚才看到在国内或者国际上也有一些企业在商业经营的问题没有成功或者破产,但是整个的行业还是在往前发展的。而且我觉得如果把应用的需求去更加的怎么考虑用户的实际需求,去更好的满足用户的实际需求,另外在技术上面采用一些更先进的技术,这样的话我觉得在未来几年的话,是有可能在这个行业有更大的一个发展的前景,不管在市场的量上面,我觉得会有一个比较大的增长,可能在这个阶段,怎么把用户的需求做好,把这个产品真正落地,真的去满足人们的一些刚性的需求,这一块我觉得也是非常重要的,对这些企业,对这个行业先稳定的去把企业发展起来,然后等待行业更大的突破机会,在那个时候再迅速的成长。我觉得整个我对这个方向还是比较看好的。

杨军:大家好,有机会跟大家做一个交流非常高兴。国内的机器人行业、机器人产业,其实可以看到过去几年,2013年是国内工业机器人行业快速爆发的起始年。从未来发展的预期来讲,大家又把目光投入了服务机器人,只是说今年随着整个的经济形势的一些变化,可能工业机器人领域有一些汽车行业的出货量的增速下滑,3C的手机的下滑,包括房地产的一些行业的调控,导致固定资产的投入的节奏放缓,所以工业机器人的增速下滑。那服务机器人这个产业跟工业机器人不太一样,工业机器人应该是一个相对成熟的产业链的结构,所有的从零部件到本体制造和技术集成,其实每一个国内的参与行业的企业都应该找到自己的位置,也经过了比较长时间的磨合,大家可以在一个比较市场化的方式来运作。但是服务机器人更多的是一些初创型的企业,目前来说大家都在寻找各自的细分领域的机会,通过一些技术的创新和细分的场景,商业闭环的一些尝试,然后靠一些资本驱动来不断的稳步发展。但是从2015年到2018年看到,从中国国内的一些投资回报的角度来讲,可能也到了资本需要去找到一定的出路,或者找到融资的一个阶段了,但是整个大环境不好,我们的金融相当于是有一些管控的新规出来以后,其实资本层面上资金也比较少,所以相对来说2018年这两个领域的机器人产业都会面临到一些困难。

但是作为海尔来讲,海尔其实是一家家电企业,家电企业作为海尔来说,海尔对于服务机器人的行业,其实我们有一个独立的逻辑,不太完全受刚才我讲的服务机器人的发展,目前所面临的问题,我们的看法可能不太一样。如果直接讲结论的话,海尔很早就一直关注服务机器人这个方向,而且在今年我们专门成立了一个服务机器人的产业团队,从战略的角度,去定制了海尔的一个服务机器人发展的规划,而且在明年我们是相对乐观的,明年会有一些新的动作和新的机会的选择。家电企业的逻辑是什么呢,大家都知道家电企业的饱和度非常高了,现在没有一个家庭说自己是没有空调、没有洗衣机、没有电冰箱了。在饱和度非常高的情况下,家电企业的发展只有一个方向,就是把原来传统的家电往这种智能化的家电去发展,把智能化的家电和它所在的物理化的周围的生态变成一个智能化的场景,然后把家里面的若干个物理空间再联合起来,变成一个智能化的全部的解决方案,进而就是我们所讲的智能家电互联网的概念。那这个方向一定是家电企业着力去发展的方向,不然家电企业慢慢的就处于一个恶性竞争的状态,产业往上走这是一个必然的方向。大家也知道未来机器人一定会进入家庭,和作为个人消费的一个场景。所以在这个结合点上,在家电发展的未来和机器人发展的未来一定会有一个焦点,这个焦点有可能会改变我们现代的生活方式,对于这种机会海尔是绝对不可能做。所以出于这个逻辑,海尔会长期的跟踪判断并且去投入到这个领域里面去,有一些大的方向的选择。

在具体的细分机会去看的话,一方面是家电的智能化,场景的智能化,本身家电某种意义上我拿一台洗衣机来举例子,现在海尔的洗衣机可以在洗之前识别衣物的面料成分,通过这个识别可以去选择一些适合衣物面料的一些洗护操作的方式,来更好的完成衣物的清洁。从这个意义上讲,可能某种意义上洗衣机也算是机器人,如果洗衣机也算是机器人的话,那海尔也算是服务机器人企业了。那跟家电相关的周边的生态,衣食住行里面的衣除了洗还要叠,还要晾晒和养护,所以未来可能除了洗衣机还要叠衣机、晾衣机,洗衣机可能是个工作量,如果能洗、能叠、能晾、能养护那就是个流水线,可能在有机器人的物理操作的功能中,把整个衣物养护的功能全部都实现自动化的话,这个场景就智能化了,本身它也是某种意义上机器人的一个方向。

除了家电的方向以外,机器人我们认为也有独立的方向。比如说服务机器人我们可以服务的是人,我们可能服务的是老年人、孩子,服务的是一些养宠物的人,服务的是一些热爱运动的人。家电是从物理空间的角度来覆盖这个家庭,而机器人是从人的服务对象的角度来覆盖这个家庭,可能机器人又会另外织出一张网来给我们的用户提供更多的差异化的体验。这种差异化的体验来改变我们的生活,而且这种差异化的体验一定是刚需,这个机会网很大,但是先做什么后做什么,又是一个战术的问题。战术的问题从我们的角度来讲就是两条线,一个就是技术的成熟度,另外一个就是需求的刚性化,我们把这两个找到一个焦点,从技术的成熟角度来说,我们一定是从单一功能向通用功能去做,不会做特别复杂的功能。从刚需的角度来说,我们服务的人肯定是最需要服务的人,肯定是老弱病幼,这些的人群可能是我们最先选择的人群。其实我们海尔是非常关注用户人群结构的,未来五到十年老龄化的情况应该是不可逆的,而且未来几亿人次的增量在增长,所以这个市场是非常大的。海尔现在已经有了扫地机的团队,有了教育机器人的团队,有了安防机器人的团队,后面我们会更关注老年人这一块,在老年人这一块里面我们会选择一些单一功能的、低成本的一些实用化的解决方案。当然进入这个领域的方式有很多,海尔确实有很多选择,可以自己组团队,也可以自己做投资,也可以自己整合行业的资源都可以,所以我们也非常愿意。其实我们是一个场景应用的平台,同时也是一个产业推进的平台,有了很好的技术,有了很好的细分领域的场景,其实海尔也是开放的,从核心技术零部件我们可以展开合作,也可以把我们的所有场景都打开。因为海尔跟客户的距离非常非常近,我们有很多的场景是通过跟客户几十年的沟通去锤炼出来的,这都是真实的场景,所以这是我们在行业里面的一些真实的想法,总的来说是比较乐观的,而且是不得不做的。

主持人:现在我们看的很清楚,海尔的转型升级,升级不是说把家电做得更好,完全不是这个概念了,要面向未来智能化的生活,场景的智能化,另外就是利用积累的优势,进一步去发展,雄心勃勃的。当然我想各位也会有很多问题问杨总,比如说海尔当然家电公司是有它的优势的,那像这样一个大的公司,刚才杨总也提到了,现在我们有很多机器人,特别是服务机器人有很多小型的初创公司,我们跟初创公司是什么关系呢?可能海尔把我们的孵化都抢去了,当然海尔也有很多很强的对手,他们也在做,也是大约看中了这样一些场景,这些也都是有挑战性的,也是非常有意思的事情。中国的产业发展应该是在竞争的状态下,都没有竞争做也做不起来,有竞争也是好事,有竞争的情况下我们怎么去做。总的来说,我觉得非常受鼓舞,就是像海尔这样的企业真正的下决心,成立了好几个团队在做机器人了。原来我接触比较早,可能在十年以前了,有人说家电的信息化就行了,不需要机器人了。当时我就说,家电做得再好,洗衣再好,衣服能洗干净,但是洗衣机又不能爬起来把衣服都找到了扔到洗衣机了,洗好了怎么晾,刚才杨总都提到了。

下面我们请张院长也给我们说一说。

张爱东:刚才几位老师和老总都说了乐观的方面,轮到我泼冷水。其实刚才英特尔张总也说到,我们现在英特尔在致力于降低机器人的成本,这个其实是我说的悲观的一个起因。因为现在做机器人,无论是处理设备还是感知设备,还是电机等等,它的成本都是比较昂贵。这里说昂贵是相对于什么来说呢?我们把机器人分成服务于人的市场和人不能去的市场,服务于人的市场其实机器人的成本就要跟人来比。比如说我们照顾一个老人,你其实可以训练、培训职业的劳动者来实现这个事情,所以这一类的机器人你直接PK的成本就是自然人的成本。这个成本合成整体是很便宜的,分成零件是很贵的,所以直接PK自然人的市场我觉得还是比较悲观的。那么什么是可能有希望的呢?第一个我觉得是孙老师说的微纳这方面一定是非常有希望的,因为人是去不了的,而且它的收益,这种靶向性的收益非常明显,这是一个非常好领域,可能是需要我们大家去做的。第二个我认为就是杨总说的把现代的家电做得更智能,服务人更好,然后加上可以运动还是不运动,因为现在的家电全是不运动的,我们加上所谓机器人家电就是能运动的家电,这个是市场很明确的,它也不用去跟谁去PK。那么我们是不是还可以找一些人做不了的事情,像刚才说的四条腿的机器人和两条腿的机器人,这个可能没那么乐观,这个世界除了陆地还有天空还有海洋,我们甚至要考虑到大海里面去,海洋里面资源很多,我们是不是可以到海洋里面做一些事情。那海洋战略其实我们国家的战略非常强的一个战略,而且像青岛还有大连、广东、深圳都提出来要做国家的海洋城市,这一块的机会也非常大。

我最近也在讨论一个海洋机器人的项目,水深通讯几十K的带宽也都是发展在几十年的这样一个历程才发展出几十K的一个带宽,它的距离也非常有限,怎么在水下实现一个不管是经济的也好,还是国防的也好,这样一种有可能也比较大的探索的机会,有可能有比较大的商业的机会。

主持人:泼点冷水也是很好的事。当然泼了冷水也给了出路,张院长的逻辑就是跟人比的现在是有它的障碍的,那人去不了人做不了的没办法,你要有刚需,这是必须要上的,这也很清晰。

那我们第一个阶段就是这样,各位专家都做了对整个行业的现状进行了回顾,也做了阐述。下面第二阶段是提问环节,大家有问题都可以提问,台下在座的听众里面有没有问题,听众的问题我们优先。

提问:各位领导、专家教授,我今天是来自潍城经济开发区医院,我们是搞医疗搞了40年,民营医院20年,我们就发现全球中医还是西医存在着诸多的过度医疗、过度检查,大部分情况下造成了很多问题,同时导致我们人本来生命是应该生老壮医,而不能生老病死。所以我们一直在反复探索,我们治疗的病人最少在40万,这个大样本、大数据,我们研发出了一个恢复生命本能的医学,在中医学和西医学精髓的基础上,我们研发了一个恢复生命本能的医学。这个医学比较复杂,它需要大数据,在这种情况下我们考虑必须要依赖人工智能机器人,这样才能够实现我们的这个医学。基于这一点我们到了美国,跟美国国会医院的团队进行互动,希望能够得到全球的人工智能和机器人专家团队和我们一块合作。大约在2000年左右,我跟美国IBM的一个总共一块在国贸探讨医学专家机器人,当时他告诉我,美国只能现在出台了一台用于保险的一个机器人,其他的还没有研制出来。

所以在这里我就想请问在座的各位专家,能不能给我们,根据我们的赋能新医学来研发出一款机器人专家。我们在横琴自贸区设立了我们的公司,寻求全球高技术的团队跟我们一块合作,所以哪位专家对这方面给我们提一些建议,或者推荐一下合作伙伴。

孙立宁:刚才讲医疗机器人有四个方向,一个是辅助医生,帮助医生一起手术,二是康复,就是对残疾人的康复训练,三是当前搞智慧病房,在医院里面代替护士这种工作,叫医用服务机器人,第四类就是基于互联网、人工智能对看片子后台帮你分析,大概这四种方向国内开展得很好了。你讲的机器人医生是不是像医生一样,通过它的数据用电脑来帮助分析,是这个意思吗?

提问:我们是一个全新的医学学科,它跟传统的中医和西医有很多的颠覆性,所以我出了十本书来解释赋能新医学,这里面有一个大数据采集,根据大数据采集做出解决方案,这个解决方案是比较复杂的。相当于可以理解成一个简单的传统的来描述的话,相当于制造一个全科医生专家机器人。

孙立宁:上个星期开了个会,我是咱们国家医用机器人的医用软件分类标准会议组成员,看心脏的片子是计算机看的,从法律上是很难去通过的,这个难度很大。一般是怎么做呢,现在的设备有很多,你通过戴上心电的传感器之后,实际上还要医生来参与。计算机可以帮你分析数据,但是不能诊断出你是什么毛病,不能替代医生,医生根据这个数据告诉你诊断和治疗的方案,这是一个很好的方式,进一步发挥医生的作用,提高效率,提高准确度,替代医生肯定不行。

主持人:刚才台上的专家在陈述的过程中,已经很自然的产生了一些问题了。我们下面请百度的黄博士,刚才您在陈述的时候已经说到了,就是无人车在某些场景下落地是非常有希望的。但是另外一些场景,特别是一般的驾驶,特别是在复杂的环境下还是有困难的。那么您也提到单纯的用学习的技术也是不太够的,所以我想是不是能够进一步的在做一些解释说明。比如说我们怎么样更好的把学习的技术和基于规则的,也就是推理的技术能够结合,能更好的处理一些复杂的场景,那么在简单的场景下,为什么这些简单的场景能比较快的落地,也请给我们进一步的说明。比如说在什么园区,在这样的一些场景和一般的驾驶场景、更困难的场景之间的区别是什么,这可能对我们的听众会有帮助。因为现在很多企业在做机器人,可能有的时候不一定能把握住难点在什么地方,这样有可能会给企业的发展带来一些困难。我们就用无人车为例,简单的场景它为什么能够更快的落地,主要难在什么地方,请黄博士进一步做一些说明。

黄新宇:因为简单场景像一个无人场景,无人的园区,有可能我们真的不需要深度学习的东西,因为机器人的活动路线,无论它是安防路线也好,它就按照固定的路线走就行了。复杂场景其实有各种各样的问题存在,深度学习它还是一个基于统计的机器学习的方式,那么这样的话它总归是我们通过有限的经验和看过的有限的东西去推一个无穷的问题。有可能特别是像自动驾驶,它有可能在复杂场景人特别多的情况下,有无穷的方式,你用有限的去推这种无限的有没有可能,它总会有疏漏,的确也会有撞人,或者说你平时的确没有看到我开着车,突然从后面有一辆车冒到我跟前想超越我,这种情况还是比较罕见的。那么在有多种光照的情况下,人有时候也不一定能够看得见这种情况,会造成你真实在采集基于监督学习的方式和统计模式的话,它是不够用的。但是在有限的场景,我们把它限制在有限的场景,比如说人很少,就是一辆大卡车,它就是从A到B,天天是一个固定路线。那我各种情况都把它考虑到,把速度降到低速,不要太高,我如果只做深度学习的话,有可能是早中晚在这条线路上把所有的信息都采集光,也试图把无限种可能降为有限种可能的方式。实际上还有很多地区性的差异,比如说在北京采集的数据,北京有很多柳条,柳条它有时候垂得很低,这也是一种没见过的场景,柳条很低,它有什么柳条很多,那么你的车一开,前面有很多遮挡物,那我是不是要踩一下刹车,我得让一下,这样就给用户造成的体验就不好了。就是我前面明明没有人,我可以开过去的,哪怕撞到柳条也是没有问题的,但是我为什么要停下,你让我忽然莫名其妙停了一下,给用户的体验就不太舒服。所以当你真的把这个东西做出来的时候,会发现有各种各样类似的问题。我还看到过一个报告,就是说在澳洲袋鼠跳跃的时候,它的深度有可能估测的不准,有各种各样的问题,我们深度学习可能要靠有限推无限的思路就不太够,这个时候结合一些规则我觉得是有效果的,就是说有一些硬性的规则你就不应该犯。比如说这边是虚线,那边是实线,你就不应该冲上去,那边有一个路阶你就不可以轧上去,有一些规则性的东西还是需要满足的,不能纯靠深度学习的方式。

主持人:还有一个小问题就是百度在做无人车,国内国外还有很多其他的企业也在做,大概相互有什么差别吗?就是从水平上或者遇到的困难方面来判断,是不是都遇到了同样的问题,还是说水平上有比较大的差别?

黄新宇:水平上肯定是有一些差距的,我个人感觉世界上现在谷歌还是属于比较领先的地位,除此之外我们百度还是很强的,在国内也是非常强的,像我也知道很多其他的厂商也都想试图进入无人驾驶这个行业,这个行业可能还是需要一定的时间。包括数据的采集,我们的数据的积累本身积累了很多年,它本身大数据的各种全国范围内的地图也好,很多城市点的数据也好,图象数据也好,这些数据的积累不是其他公司在新进的特别是一些创业公司,你真正要把这个东西做好,实际上还是基于一个大数据,很耗费人力的一个东西。有了这样的大数据,还有现在深度学习的方式的话,你还要标注,这都是一些很耗费资金的项目,比如说像我们20万的这种,当然是很小量的。我们开放给学术或者开放给大家,真的是千万或者是上亿的标注的话,其实它还是很耗费资金的。那么怎么去开发自动标注还有自动学习,这都是这个领域里面一些比较重要的课题。

主持人:咱们都知道无人车是很难的一件事,所以刚才黄博士说实际上谷歌这家公司稍微强一些,但是前不久这家公司的老总也说了,在任意情况下的无人驾驶路还非常长,还要等很长的时间。从这个角度,我觉得跟百度面临的也是类似的问题。这个面临着什么呢?就是刚才黄博士说到的一个很值得我们机器人人工智能企业或者用户单位都需要注意的,他刚才说到非常关键的一点,就是如果你的场景里面,你把它经过分析、分类等等,如果是有限多种情况,那么这些情况如果都能分析清楚,只有有限多种,那都是能够处理的。所以这样的问题即使难度大,我们还是有希望去解决的。但是如果你看上去就那么简单,实际上一分析它有无限多种情况,或者说你找不到某一个数值,比如说100种,就是100种,没有101种的,你找不到这样一个上界,这样的问题是非常难的,包括深度学习都不能很好的处理。我想百度觉得这样的问题处理不了,谷歌处理不了,其他的企业也都是类似的。所以这是我们发展机器人产业非常值得注意的一个经验,也针对我们自己的问题去做这样的分析,如果真是碰到那种你要处理无限多种场景的话,你是不是要考虑考虑了,如果碰到这样的问题是要考虑了。如果你碰到不是这样的问题是非常好的,是非常有机会的,就是近期是非常有机会的。这是给我们的一个一般性的建议,这是我的一个解读。

提问:我有一个问题问英特尔张总,英特尔是怎么计划的,战略上,是想自己开发一个完整的服务机器人,还是你们可以把人机交互的算法,像那种开放的软件可以开放给海尔这种?

张益民:这个问题也非常好,英特尔这边也知道,我们过去的商业模式一般是跟生态系统伙伴来合作推出最终的产品。比如说在PC领域,我们也提供CPU一些相应的技术,然后由这些其他的合作伙伴来做最终的产品。所以在服务机器人我们目前的思路也是类似的,就是我们在其中去提供一些比较核心的部件或者技术,来帮助我们的合作伙伴去最终推出这种服务机器人的产品。这个里面应该说包含硬件或者是一些软件方面,海尔也是我们在PC方面的一个重要客户,所以今后肯定会有合作的可能性。而且我们现在也是在建立服务机器人的生态系统,有不少的伙伴都已经加入进去了,所以这肯定是我们这项技术最终肯定会提供出来,让大家一块使用。目前我们在研究院的一些技术,我们目前就已经分享出来了,当然并不是所有的,刚开始是开源,但是这些肯定是让技术可以为大家充分的使用,做进一步的改进,适合于各自的产品的需求,就等于让大家在这个领域也是充分的可以做更多的创新。

提问:我想问一下孙院长,纳米机器人看到的结果好像都是实验室的结果,所以真的到实际应用要走多远呢?因为很多具体的问题,包括安全性,肯定是越小越不好控制的。

孙立宁:前一段国家科技部有一个专家论证,关于微纳米操作机器人还有多远,我写的比较保守,我说还有30年。因为像我们的药丸子这件事情,那是很大的,它比那个简单多了,2002年立项,它的原型出来是2004年,如果进到血管的话,我们认为得能到十年左右的时间,能走到病变的过程,真正有效果得二十年。包括像视网膜也做出来了,对盲人来讲就能看到光,目前是做到了16×16个电机。所以你问这个问题要多长时间,恐怕也得三十年。

黄新宇:我说一下开发平台的一些事,我知道像英特尔、百度都公开了很多开放的平台,都有这样的项目,我觉得非常好。因为我本身在这个实验室主要是做自动驾驶相关的,但是百度本身也有类似的这样的平台。比如像百度大脑这样的平台,它其实提供了相当多的人工智能的功能全是免费的,例如语音识别,无论是文本扫描、图象视频、各种数据,像它今年上线一个智能小程序,针对手机客户端的一个开发的话,实际上你可以定制自己任何企业想要的小产品,比如说我们将一个人说的话转成流行音乐、转成说唱的一些功能。这样的好处就是你自然而然通过这种东西,你就自然而然能够用到百度自己开发的一些AI的功能,各种功能你可以使用它。这些功能本身是基于百度后台海量的数据训练出来的模型,所以等于说你免费应用了百度语音识别也好,图象识别也好,文本检测也好,各种功能全都可以集成在一个庞大的平台下面。

主持人:现在的压力就到杨总了,百度、英特尔都有开放平台的支持,海尔这么大的企业有什么样的举措?

杨军:海尔这边其实对于产业的认识,我们自身的定位和对这个产业发展的认识和目标,我们是判断我们不希望做零到一的事,如果有了这种比较开放的资源和先进的技术,能够整合到我们的系统里面来,我们是非常欢迎的,我们海尔是擅长做1到1000,这是我们擅长的。所以刚才也提到了一个问题,就是海尔是规模比较大的、体量比较大的企业,服务机器人现在的行业规模还处于发展比较早期、规模不是很大的行业里面进来的话,对其他的行业里面的这些初创型的企业是一个什么样的定位和关系。

其实我刚才在讲述海尔对于未来智慧家庭战略判断的时候,更多的是讲到服务机器人对于海尔的主战略的关系,在这个协同关系范围内,海尔是要主导的,比如说家电的智能化,比如说家电周边生态的智能化,甚至于说未来面对海尔最关心的核心用户的体验的产品。海尔这么大的体量还有很多,比如说海尔的生产,海尔在全球有108个工厂,海尔的物流,海尔面向中国数以千万计的家庭用户单位,我们大概有全国最大的大物流的服务商叫叫日顺,这是一个独立的品牌,它一年运营的规模也超过100个亿,在中国有600万平米的智慧仓库,有9000辆车每天跑在全国各地运送海尔的家电产品。因为它跟小的电商物流的快递件不太一样,它不能放到小的快递柜里面,都一般要送到家里面,而且送货的服务跟安装的服务要一体化。现在在这种领域的需求,包括海尔的线下渠道,海尔全国有3万家以上的线下门店,刚才也提到了智慧零售,也是英特尔这边打造的一个场景。在这类跟海尔的业务间接相关,但是也有支撑作用的领域我们是完全开放的,我们就是用户,我这边可以提供最直接的需求,而且可以把这些需求都参与到我们这个需求的方案解决里面来。因为现在初创型的企业,企业资源的关系,往往选择B端的市场机会,直接2C端的初创型的企业选择市场其实比较少,B端的往往跟我们这种需求是能够对接起来的。在送装里面最后一公里,大量的没有被改造的场景还是非常多的。现在冰箱和家电是越做越大,越做越重,整个从送装车到用户家里面去,上下楼梯的这一块的工作量是很大很大的。如果有自动化的上下楼梯的搬运设备,或者像外骨骼助力这种设备,如果可以用的话,其实在家电行业里面的对于这个的需求是非常现实的。所以从这个角度来讲,我们跟大家是一个相互合作的关系,都有很多的合作机会。

主持人:谢谢杨总也给我们提供了很多机遇,他有很多需求了,愿意合作的,如果我们有初创公司或者自己有技术、有产品,可以在这样的场景中去应用的可以找杨总。现在我们三位来自企业的都表态了,现在我们的张院长、孙院长,你们两个是代表大学的,而且两位都是院长,那我们高校的科研团队在当前的形势下,我们怎么跟社会上,跟各界怎么加强合作,请两位谈一下。

张爱东:我在华为搞了五年,华为跟高校的合作。其实企业跟高校的合作,我站在企业这边来说可能好说一点。因为高校的能力并不是在产业化上,而是在试错上。从企业这边要跟高校合作的话,就是这个企业要相对长期的技术研究的东西,可能放到高校合作会比较好,你不要说我现在产品急用什么,找一个高校老师来帮你做,高校的机制和团队的构成、结构是不能实现这种事情的。当然刚才海尔杨总说的搬家电上楼梯,好像找到合适的高校能够搞定,因为这是一个比较明确的需求,因为家电是固定的物体,甚至形状都是方的,把它搬上楼梯,这种很明确的可以找高校来做。但是太开放的,企业都没搞清楚我要干什么,找高校来合作的话可能不太现实。以前我跟高校合作都是技术研究的,面向未来关键技术的这样一些试错,就是试错这种模式的会多一些。

 

孙立宁:这个话题挺难的,中国机器人产业的地图,一个机器人的培养可能需要经过五年到十年,能用上,中国的发展缺人,高校的重点就是培养人才,这一点非常重要。第二从技术创新来看,你说今年的工业机器人也好,今年的服务机器人也好,你如果倒推的话,都是二三十年前大家做的,没有那个时候大学的培育做储备就没有今天,宏观上这是一个本质规律,所以应该围绕未来的发展做好科研的铺垫,通过人才离开学校,到社会。再一个我同意张院长的角度,合作的模式太多了,过去一个项目做一个项目的合作都很累,效益不高,并不解决问题,而应该企业跟大学从战略上去合作,企业更多在应用、关键技术这方面,大学还是发挥特长,在方法上结合,而不要做到应用层面上。那问题就是看两家处的怎么样,大学可能是看得脚底下比较多,企业可能看的是现实的比较多。各地去搞产业研究院、协同中心等等,这里面可能大学发挥主体力量,它能够把人才技术落进去,开放给企业合作打造一些新型的混合所有的研发机构,用商业模式来做,可能也是打造一种创新转化的平台,这些模式都有缺点,但是合作是对的。

 

主持人:张院长可能是从大学本身的体制出发的,孙院长已经提到了可能会有一些新的机制,那我也顺便补充,现在在大学也在做体制的改革,比如说我们这个学校,中国科学技术大学,过去在产业化方面是非常落后的,可能是全国最落后的高校。我们现在的压力就非常大了,现在迫使我们下决心,当然政策还没有完全出来,但是已经有这个想法。就是要用全新的机制,它说起来是大学的一个研究院,但是它不是大学的机制了,它的考核不是考核论文了,它的人才、整个的机制都是新型研发机构,它就是针对企业的需要、行业的需要、社会的需要去做科研,它的优势就是有大学的老师,更重要的是有一些高材毕业生,可能在这个新型的研发机构里,跟企业一起做。这也是对中国未来机器人整个行业的发展,给我们的高校做我们的贡献。

因为时间关系,我们最后一个环节就非常简单了,就请五位嘉宾最后再展望一下,2019以及未来机器人产业有什么寄语。

 

孙立宁:我刚才已经说过了,我这边还是从打造中国的生态圈,回到主题,机器人产业发展的融合创新机制的落地。

 

黄新宇:展望上我觉得人工智能在机器人行业能有更多的应用,像现在我们这个团队在做无人挖掘机,我觉得在这个方向,甚至在船舶方向,希望能有更大的突破。

 

张益民:我们英特尔研究院这边过去三年也对服务机器人这一块的技术不断的在做研发,也有一些成果出来。那么2019年我们也希望跟产业界的伙伴有更多的合作,把我们开发的技术也可以做更多的测试,给我们更多的反馈,我们共同把这个行业再往前推进。

 

杨军:海尔还是比较看好未来的服务机器人跟未来的智慧家庭结合的方向,但是2019年再往后的话,我们也不会盲目的去乐观和行动,更多是要聚焦在一些细分的场景和刚性的需求。我们希望能够在国内看到更多的除了扫地机、无人机、平衡车以外的,带有一定数量规模的这种C端的服务机器人的产品能够被用户所接受,然后也让行业有一个更好的良性发展空间环境规模能够越来越大。

张爱东:因为这是产业会,所以对企业说一句话就是我们做研发投入风险非常大,但是如果一个企业不投入研发,那就是没有机会。

主持人:最后我简单把我们今天分论坛也谈不上总结,我最后有一点感想。因为今年产业发展大会的发展是融合发展,深化应用,今天下午的报告分享和对话都是围绕这个主题的,我们这些企业家和我们的高校都愿意融合发展,也都需要融合发展,这是我的一个感想。另外我想对明年和未来几年,我有一个想法,我觉得从现在很多方面看很多企业,特别是粗放的企业都面临着很大的压力。但是毕竟我们这些2018是坚持过来了,2019要继续的坚持住,2019坚持住,我觉得到2020这个形势就会变好,2020坚持住,到2021年,我们整个行业,服务机器人行业、特种机器人行业就会有更大的发展,我的期望是这样。

谢谢大家!