2015 年全球专业服务机器人市场规模46 亿美元,个人/家庭服务机器人市场规模22 亿美元,2016-2019 年有望迎来持续快速增长。IFR将服务机器人划分为专业服务机器人和个人/家庭服务机器人。根据IFR统计,全球专业服务机器人市场2010-2015 年CAGR 为5.1%,个人/家庭服务机器人市场同期CAGR 为33.6%。IFR 预测,2016-2019 年,全球专业服务机器人市场将累计销售231亿美元,个人/家庭服务机器人市场为242 亿美元。据此测算,2016-2019 年,专业服务机器人市场CAGR 为9.4%,个人/家庭服务机器人市场CAGR 为45.0%。
技术端:机器人智能性达到商用水平,API 与模块化加速产品研发迭代
1 深度学习大幅推进服务机器人的智能性
深度学习是人工智能发展的重要里程碑,推动语音交互和图像识别领域的快速发展。从1956 年达特茅斯会议开始,人工智能发展已历经3个阶段。(1)第一阶段:推理期(1956-1960s)。这一阶段的主题是将逻辑推理能力赋予计算机系统,主要成就是开发出自动定理证明系统等;(2)第二阶段:知识期(1970s-1980s)。这一阶段研究人员致力于将人类的知识总结出来并交给计算机系统,主要成就是开发出了专家系统;(3)第三阶段:学习期(1990s 至今)。研究者试图让计算机自己学习知识,这一阶段的重要突破是深度学习的提出和发展。Hinton 在2006 年提出了深度学习算法,2012 年Hinton 的团队利用深度学习算法在ImageNet 上大放异彩。随后深度学习获得业内广泛关注,同时吸引IT 巨头的持续巨额投入,进而推动了语音识别、图像识别、自然语言处理等领域的高速发展。
语音交互正在成为服务机器人人机交互的主流技术之一。人机语音交互的方式更类似于人与人之间的交流模式,目前服务机器人产品大都采用语音交互模式。国内服务机器人主要采用科大讯飞、百度、思必驰、云之声等企业提供的语音交互模块。苹果、谷歌、微软、亚马逊、Facebook、IBM 等IT 巨头都已经布局各自的语音识别技术。
得益于深度学习技术,语音识别取得长足发展,目前在某些领域已经接近甚至超过人类。从1970 年开始,语音识别技术发展迅速,机器识别单词数量呈指数式增长。目前,各主流语音识别平台的单词识别准确率均已超过90%。2016 年10 月,微软语音识别技术在行业标准Switchboard 语音识别任务测试中,实现5.9%的错误率,已经达到专业速记员的水平。
图像识别能力已达到人类水平。图像识别能力同样是服务机器人人机交互领域的重要组成部分。2012 年,Hinton 的团队利用GPU 训练神经网络模型,将错误率由26%大幅降低至15%。此后,错误率逐年下降,到2015 年,微软亚洲研究院计算机组的错误率已经低至3.6%,而人眼识别错误率为5.1%。
2 API 和模块化提升服务机器人产品的开发和迭代速度
API 和模块化提升服务机器人产品的开发和迭代速度。服务机器人的智能模块包括感知交互、认知决策、定位导航、运动控制等,技术跨度范围极大。服务机器人初创企业一般最多只能对其中某一个模块有深入研究,甚至许多初创企业只做平台集成。在这样的背景下,人工智能技术的API 接口开放和核心零部件的模块化,无疑大大降低了服务机器人厂商产品开发和迭代的难度。目前,在服务机器人核心技术环节涌现出一批优秀的企业,推动服务机器人集成产业走向成熟,使得服务机器人集成商可以将精力投入到产业化应用和商业模式的探索中。
人工智能API 让服务机器人厂商能够借助外部力量实现产品的智能性。目前已有大量的开放的人工智能API(Application Programming Interface,应用程序接口),范围包括(1)机器学习和预测,(2)图像识别,(3)文本分析、NLP 和情感分析,(4)机器翻译,(5)语音识别。互联网巨头也开始加入开放人工智能API 的阵营中。2015-2016 年,谷歌陆续推出Google Cloud Vision API 和Google Cloud Speech API,其可被应用于软件或设备中。
连接上这两个API 的设备可以将图片和语音上传到谷歌云端,经过云端处理后,会返回需要识别的图像和语音内容。微软开放的API 包括表情识别、语音识别、视频识别等。人工智能API 接口开放大大降低了服务机器人厂商实现产品智能性的难度。
核心部件的模块化加速了服务机器人厂商的生产研发过程。核心部件的模块化有利于服务机器人厂商通过外购的方式获得机器人产品所需的功能。以导航移动模块为例,思岚科技推出模块化机器人自主定位导航系统SLAMWARE,其仅有硬币大小,集成了基于激光雷达的同步定位于建图(SLAM)及配套的路径规划能力。宿主系统可以利用SLAMWARE 提供的通讯接口,并结合SDK 实时获取的高精度机器人位置信息与SLAMWARE 自主构建的环境地图数据。
应用端:两类目标用户,三类产品作用,构建“六维度模型”
1 服务机器人“六维度模型”
根据目标用户和产品作用,构建“六维度模型”。各类服务机器人相互间差异化极大,例如,达芬奇手术机器人、科沃斯扫地机器人、大疆航拍无人机,虽然都属于服务机器人,但其背后的产品逻辑显然是不同的。我们从目标用户类型和产品作用类型两个角度对服务机器人的应用端进行分类,首次提出服务机器人的“六维度模型”。这样分类的优点在于:(1)避免笼统地将所有服务机器人放在一个框架下讨论。例如,我们将指出人力成本上升仅能够推动“替代人类”的服务机器人产品发展;(2)避免陷入穷举罗列相关公司的困境。IFR 将服务机器人分成2 大类,13 小类,具体产品上百种,穷举罗列的方式无法构建分析主线。
分类角度一:按照目标客户类型,分为to B 和to C 两类产品。同样类型的服务机器人,主打to B 市场还是to C 市场,决定了其不同的发展模式。例如,to C 的航拍无人机和to B的缉毒无人机,在价格定位、销售渠道、商业模式上都有明显的区别。(1)to B 的服务机器人:主要是指专业级服务机器人,面对的客户是企业、政府、机构等。类型包括军用、农牧、物流、运输、医疗、建筑、清洁、检测、水下、救援等。(2)to C 的服务机器人:主要指家用和个人服务机器人,面对的客户是个人或家庭,类型包括家务、娱乐、教育、养老护理、安防等类型。目前,我们也观察到to B 的企业和to C 的企业在产品上有交互融合的趋势,例如,大疆在占领to C 的航拍无人机市场后,又推出to B 的农业植保机。
分类角度二:按照产品作用类型,分为替代人类、辅助人类、创造新领域,三类产品。
(1)替代人类:为了降低人力成本或者提高工作安全性,在很多领域已经开始用服务机器人去替代人类的工作,例如酒店送递机器人和防爆机器人;(2)辅助人类:在部分领域,服务机器人并不是为了替代掉人类,而是提升工作质量,典型的例子是达芬奇手术机器人和IBM Waston;(3)创造新领域:服务机器人发展也创造了许多新领域的尝试,目前这些领域大都处于市场探索和验证阶段,例如智能虚拟助理、情感机器人、编程类的玩具机器人等。
2 两类目标客户:to B 产品和to C 产品
(1)to C 产品
to C 的产品主要关注价格、易用性、产品生态。to C 的产品直接面对终端消费者,前期需要大量的市场培育和推广支出,所以相较于to B 产品,其实现收入和利润的周期一般较长。to C 的产品的优势在于能够逐渐形成自身的品牌优势和产品生态。我们认为,满足以下三个标准的to C 服务机器人企业值得我们关注,(1)低价而又高性价比的产品;(2)易用性强,能够被消费级用户快速学习、使用方便的产品;(3)围绕核心产品建立产品生态。
关注点1:低价而又高性价比的产品。打开to C 市场需要两点,(1)产品智能性能够满足客户的理性期待,这点主要通过更多数量和更高质量的智能模块集成来实现;(2)产品价格足够低,满足C 端客户的承受能力。基于这两点,to C 的厂商需要在技术追求和成本控制之间取得平衡。目前国内已经脱颖而出的to C 服务机器人公司,例如大疆、科沃斯、优必选等,都是通过低价,同时又高性价比的产品来打开to C 市场,并实现规模化销售。
Pepper机器人应用于雀巢专卖店
把消费者价格承受能力高的海外市场作为突破口,是to C 厂商“曲线救国”的方式。国内市场C 端客户的价格承受能力弱于国外市场,同样成本的服务机器人产品在国外更容易打开市场。除价格承受能力较高外,海外C 端客户对于DIY 和机器人的使用有良好的历史积累,而国内机器人消费群体仍在培育之中。大疆和优必选等公司都是先打开海外市场并建立行业地位,再转而开拓国内市场。2015 年,优必选Alpha 1S 国内销售占比约为15%,大疆国内销售占比约为20%。
关注点2:易用性强,能够被消费级用户快速学习、使用方便的产品。to C 的服务机器人较普通消费电子产品集成了更复杂的智能模块,也增加了其使用难度,而C 端客户本身并不具备专业能力。易用性强是打开to C 市场的前提条件,目前比较成功的典型例子包括:
(1)优必选开发3D 可视化编程系统,即使是儿童用户也可以通过操作图形界面来对Alpha1S 进行动作编排,其易用性大幅领先采用编程语言进行动作编排的竞品;(2)大疆通过增稳云台等技术,让消费者用户也可以拍摄出高质量的画面内容。
关注点3:围绕核心产品建立生态。to C 的服务机器人产品具有行业门槛低和产品迭代周期短的特点,一款明星级产品容易引来大量的模仿者。单依靠一款明星级产品很难在行业内长久保持领先优势,企业需要构建自身的生态来维护其领先地位。(1)大疆无人机:在产品方面,大疆针对不同消费者需求和工业级需求建立和完善其无人机产品线;在用户方面,大疆建立飞友生态圈,通过分享、竞赛、社区来积累数据,精确刻画用户特征;(2)优必选:优必选建立了包括Alpha 1S、Alpha 2、和迪士尼合作IP 的玩具机器人、积木机器人在内的多元产品线,形成家庭应用的数据闭环。
(2)to B 产品
to B 产品主要关注产品效用、稳定性/安全性/耐用性、应用场景选择。to B 的服务机器人产品面对的客户群体是企业、政府、机构等,相较于C 端客户,B 端客户的特点是更加理性,其更多是从购买服务机器人产品的成本和效用比较来做出决策。我们认为,满足以下三个标准的to B 服务机器人企业值得我们关注,(1)产品能够切实解决客户痛点;(2)产品具有较高的稳定性、安全性、耐用性;(3)对产品应用场景有着深刻理解。
关注点1:产品能够切实解决客户痛点。B 端客户的购买决策更理性,其更注重服务机器人产品是否能够有效解决其商业痛点,而不会轻易为不实用的功能买单。Aldebaran Robotics(软银的法国子公司)旗下的NAO 和Pepper 是国外优秀的人形机器人,由于单价较高,这两款产品目前在to B 市场应用较多,(1)NAO 机器人目前主要应用于学校、科研机构、政府有关项目部门等。例如,NAO 机器人被欧洲L2TOR 项目选用,利用NAO 机器人的语音交互功能,来帮助欧洲移民儿童学习新国家的语言;(2)Pepper 机器人应用于商用领域,例如,雀巢公司在日本家电商场启用Pepper 机器人来销售其咖啡机。但目前,Pepper 的发展与原先的期待仍有差距,除了通过新奇感吸引客户外,怎样切实帮助商家服务客户,仍是其需要解决的问题。
B 端客户对价格的承受能力更强,单价要高于to C 产品。根据IFR 报告,2014 年服务机器人市场中,to B 产品销量占比仅0.5%,但其销售额占比达到63.1%。B 端客户相对于C 端客户更加理性,更关注的是购买服务机器人产品的成本收益比较。尤其在医疗服务机器人领域,达芬奇手术机器人达到千万级价格。
关注点2:产品具有较高的稳定性、安全性、耐用性。(1)稳定性:B 端客户对于服务机器人故障的容忍度低,例如,医院送药机器人临时出现故障可能引发医疗事故;(2)安全性:在商场、酒店、会场等人流密集领域应用的服务机器人产品更加强调其安全性;(3)耐用性:进入B 端市场的产品具有较强的资本属性,其使用寿命、折旧速度、维修成本等都是B 端客户重点考量的指标。目前to B 服务机器人大部分处于市场开拓初期,需要通过不断地应用场景实地试验和产品更新迭代来完善产品的稳定性、安全性、耐用性。以国内应用于商场的服务机器人为例,目前需要解决的问题包括高噪音环境下的人机对话能力、人为干扰时的反应能力、WIFI 等信号弱时的应急能力等。
关注点3:对产品应用场景有着深刻理解。服务机器人=智能模块集成+特定功能组件,在同样的智能模块集成下,选择怎样的应用场景并搭配相应的功能组件,是to B 服务机器人产品开拓市场的关键。同样以室内导航移动为核心智能模块,Aethon 和Savioke 选择了不同的应用场景。(1)Aethon 的TUG 机器人主要在医院工作,提供送药送餐、运送医疗废弃物、以流媒体形式让医护人员和病人通话等服务;(2)Savioke 的Relay 机器人主要在酒店工作,可以替代酒店员工为客房送递吹风筒、毛巾、外卖等物品。国内的云迹机器人也是针对酒店送递设计的服务机器人,其应用场景的选择和国内医疗设备审批流程复杂等原因有关。
3 三类产品作用:替代人类、辅助人类、开创新领域
(1)替代人类
替代人类的服务机器人主要关注其能否降低人力成本或提高工作安全性,以及应用场景的延伸能力。由于人力成本上升和人口老龄化的趋势,目前有大量企业试图通过服务机器人去替代人力工作,典型的例子是仓储机器人。此外,服务机器人在部分高危险性的工作中也已实现对人的替代。由于此类机器人是在原有领域替代人类工作,其价格需要以人力成本作为参考,其定价一般不能高于其所能替代的人工的薪酬成本。目前,市面上主流的迎宾、导购、咨询等类型的机器人价格都在5-20 万之间,和人力成本相比竞争力并不明显。但此类服务机器人如果能够实现量产销售,价格有望下降,其替代人工的竞争力也将加强。市场上也的确存在远高于人力成本的服务机器人产品,例如价值30 万以上的迎宾机器人,我们认为商家采购此类产品并非只为了替代人工,还为了用机器人来吸引客户关注。满足以下两个标准的此类服务机器人企业值得我们关注,(1)有效降低人力成本,或有效提高工作安全性;(2)产品具有延伸应用场景的能力。
关注点1:有效降低人力成本。服务机器人被广泛应用于需要降低人力成本投入的领域。(1)一个典型的例子是亚马逊的KIVA 仓库机器人。2012 年,亚马逊以7.5 亿美元收购KIVA并获得其物流自动化技术,该技术每年能够帮助亚马逊节省9 亿美元人力成本开支。据物流咨询公司MWPVL 测算,使用KIVA 后,亚马逊每发一件商品能够节省21.3 美分,也即48%的成本;(2)在to C 领域实现对人类工作替代的典型例子是科沃斯和irobot 的扫地机器人。有效提高工作安全性。例子包括,(1)军用领域中大规模启用服务机器人来替代人类从事高危险性工作。例如,军用排雷机器人装有探雷器和使地雷失效装置,可以加快扫雷破障的速度,大大降低了人员的伤亡;(2)朴蜂科技的玻璃外墙清洗机器人ispider 可以自主对建筑外墙进行清洗,替代了“蜘蛛人”们高危险的外墙清洗工作。
关注点2:产品具有延伸应用场景的能力。在扫地机器人获得成功后,重复性的家务劳动替代市场被验证。在此基础上,服务机器人厂商进一步挖掘相关市场潜力,主要从两个方向展开,(1)临近市场的拓展:同样在家务劳动替代市场,厂商开发出自动清洗玻璃机器人和自动除草机器人,案例包括科沃斯的WINBOT 玻璃清洗机器人和JOHN DEERE 的自动除草机器人,(2)目标客户的拓展:科沃斯扫地机器人原先是针对to C 市场,2016 年公司又推出to B 的应用于太阳能光伏发电站的太阳能面板清洁机器人锐宝RAYBOT。
(2)辅助人类
辅助人类的服务机器人关注技术优势,以及技术在应用场景落地能力。服务机器人和人类可以是协作关系,通过有效利用人工智能、运动控制、人机交互等技术,来提升人类现有工作效率。“辅助人类”的服务机器人发展的主要推动力是相关技术进步,在这一领域,一般是具备技术优势的企业占据行业领导地位,典型的例子是达芬奇手术机器人和IBM Waston。此类服务机器人价格主要以其对提高人类工作的价值为参考。以达芬奇手术机器人为例,使用其辅助手术,一般需要在传统手术费用基础上增加3 万元,这3 万元增量价值反应了达芬奇手术机器人对医生做手术质量的提升。目前,达芬奇手术机器人在国外售价为100-150 万美元,在国内售价为300 万美元。我们认为,满足以下两个标准的此类服务机器人企业值得我们关注,(1)具有技术领先优势;(2)具备技术在应用场景落地能力。
关注点1:产品具有技术优势。典型的例子是手术机器人,其对机械运动控制的要求极高。达芬奇手术机器人由外科医生控制台、床旁机械臂系统、成像系统组成。使用达芬奇机器人,医生获得放大10 倍的三维视觉、更舒适的手术环境、更高精度的手术动作,从而提升手术质量。其他明星级医疗机器人还包括眼科手术机器人Auris Surgical、植发机器人ARTAS、柔性医疗机器人Medrobotics 等。
关注点2:具备技术在应用场景落地能力。典型的例子是IBM Waston。IBM 发展人工智能技术的目的不是用机器来来替代人类,而是从人工智能中提炼出核心技术,例如深度学习和模式识别等,再利用这些核心技术帮助人类克服自身的不足。目前IBM Waston 主要在医疗领域得到广泛应用。此外,IBM Waston 还在诸多领域进行尝试,包括,(1)球队数据分析:NBA 猛龙队与IBM 合作,用数据分析来挑选球员、制定比赛对策、临时调整对阵方案。改变了以往教练拍脑袋做决定的情况;(2)智能穿戴监测健康状况:Waston 通过分析用户数据,为用户提供运动建议;(3)与机器人本体厂商合作:IBM 把Watson 植入到机器人产品里,使其能够实现人机交互;(4)帮助政府治理雾霾:Waston 通过分析空气流动、排污情况、社交网络评论和照片等数据帮助北京市政府对抗雾霾;(5)协助政府推行分级诊疗:Waston 通过对公众信息、医院信息、病人信息等的认知分析,给决策者提供及时的报告,评估推行政策的效果和问题。
(3)创造新领域
应用于创新领域的服务机器人需要关注是否存在真实需求。随着服务机器人技术的发展,厂商不满足于只在原有领域替代或辅助人类工作,也开始挖掘新的需求领域,目前大都处于市场探索和验证阶段,例如智能虚拟助理、情感机器人、编程类的玩具机器人等。此类产品一般是进入全新的市场领域,需要跟踪验证其所创造的新需求领域是否是真实的需求。
Amazon Echo 智能音箱大获成功,引来大批模仿者。Echo 是Amazon 于2014 年推出的智能音箱。Amazon 将个人虚拟助手Alexa(类似Siri)预装在Echo 中,用户可以通过与Echo 对话来实现新闻播报、天气查询、创建任务提醒、播放音乐、操控智能家居等功能,Echo 有潜力成为未来智能家居的中控平台。Echo 售价180 美元,累计销量已经超过300万台。Echo 的成功因素包括,(1)市场需求真实存在:Echo 通过家庭音箱的形式敲开市场,这本身是巨大的刚需市场;(2)技术方案切实解决用户痛点:原来使用音箱需要经过开机、选曲、调音等操作步骤,而Echo 在听到唤醒词“Alexa”之后,就能马上根据用户的语音指令开始工作;(3)Amazon 将Echo 当成战略产品来投入研发。Echo 不仅仅是一个音箱,其还是物联网时代的家庭入口,Amazon 已经组建超过千人的研发团队,在技术上建立起对竞争对手的优势,例如,Echo 的平均响应速度已经做到了1.5 秒以内。Echo 的成功让竞争者看到了智能音箱市场的潜力,2015 年,科大讯飞和京东合资成立灵隆科技,并推出叮咚音响;2016 年,Google 推出Google Home。相较于Echo,Google Home 的特点包括(1)深度整合Google 所提供的各类服务;(2)支持多房间多设备同步使用;(3)仅用2 个麦克风组合,而Echo 是6+1 麦克风阵列;(4)更加定制化的外观。
MIT 推出情感机器人JIBO。JIBO 是由麻省理工学院媒体实验室的团队研发的家庭社交机器人。据开发团队介绍,JIBO 具有情感感知功能,能够对用户情感进行识别和交互。JIBO将主打中高端家庭市场,同时,一些B 端的地产、酒店等也是潜在用户。JIBO 在2015 年8月的融资中引进了来自中国、日本、韩国的投资者,为进入亚洲市场做足铺垫。其中,东方网力公司投资200 万美元占2.34%股权。东方网力还将帮助JIBO 完善视频通话和汉化方面的工作。此外,GQY 视讯也于2015 年11 月投资900 万元人民币占1.1%股权。但目前,JIBO 的产品发布一再推迟,其市场潜力仍有待观察验证。
微软小冰模拟人类唱歌,拟进入虚拟歌手市场。2016 年8 月,微软召开了第四代小冰的发布会。微软团队利用大数据训练,新的小冰已经能够模仿人类唱歌,她演唱的《隐形的翅膀》和《夏日甜心》主题曲已经获得了广泛的关注。目前最有名的虚拟歌手是日本的初音未来,其演唱主要是使用电子音合成技术生成,并通过3D 建模和全息投影技术来举办演唱会。微软小冰通过人工智能技术来学习演唱,有望走出虚拟歌手新的成长路径。