演讲中,傅盛提到,人口红利消退,企业很难保证万人一致的高水准服务和低成本运营,这是服务产业升级当前遇到的瓶颈。为了破解这一难题,猎豹移动携旗下人工智能公司猎户星空自主研发了 AI全链条技术,致力打造真有用机器人,助力中国服务产业升级。『让每个小卖部都能提供五星酒店的服务,让每个乡村都能品尝到金牌大师的咖啡』。
以下是演讲全文:
非常感谢主持人,两年前猎豹移动在全球移动端大概拥有6亿月度活跃用户的时候,我在思考一个问题:什么是下一个更大的机会?
任何一家企业都是这个时代孕育、生长出来的。所谓的创新,无非是在社会快速变化的时候,抓住社会领域之间产生的缝隙(机遇),然后把需求发掘出来而已。
我个人并不认为我们有机会去做所谓的创新,我们更多的是做发现,去发现这个社会需求的变化,然后在恰当的时候,做一些恰当的事情,然后让它自然地生长。
在国内竞争太激烈的情况下,我们选择了国际化,我们开发了猎豹清理大师,专门来清理手机上的垃圾和病毒。到今天为止,猎豹清理大师已经有几亿的用户。猎豹移动在美国有几千万的用户,所以很早就在硅谷设立了办公室,我自己也在硅谷生活过一段时间。
大概在4年前,我发现中国移动互联网的应用,已经领先于美国了,在那里上网购物不可能像北京一样,几个小时就能送达。在应用的研发还有产品服务上,中国是全面领先美国的,很多外国人到了中国之后不想离开,因为在中国,拿出一个手机就能满街跑,但在很多地方完全做不到,甚至像日本的很多地方还只收现金,每次去我都很头疼。
一、人工智能带来新的机遇 服务机器人助力中国服务产业升级
中国之所以有今天这样的服务产业发展水平,实际上是依赖了互联网技术的极大发展。
我记得有一次我跟Snapchat的CEO和软银的前CEO在东京吃饭。软银前CEO年纪比较大,他就说在东京,开车30分钟内可以到任何一个口味的餐馆,生活非常舒服。Snapchat的CEO才20多岁,像一个高中生一样,但他说的一句话让我印象非常深刻,他说这也许就是日本互联网落后的原因。
有的时候,一个领域过于发达以后,其实也限制了下一个领域的崛起。
中国正是由于在工业化进行到一半的时候有了互联网化,所以互联网使得服务业实现了大幅度的升级。
但是我认为这波升级也到了一个转折点,服务产业也会进入一个瓶颈期。
为什么这么说呢?我有个好朋友叫沈鹏(前美团外卖负责人&创始人、水滴互助、水滴筹创始人&CEO),他离开美团后创办了一家叫水滴筹的互联网保险公司。我说你为什么会去做互联网保险呢?他说,以前在美团指挥上万个外卖小哥的时候,每天都会有外卖小哥遇到各种各样的意外,他们就在群里筹款。后来沈鹏就想,如果创业的话,一定要做一家能够帮助服务人员提高生活待遇和基本生活保障的公司。所以,他就萌生了做互联网保险的想法。
其实今天服务产业增长的瓶颈在哪里?我相信大家一定能看到。
从社会背景上来看,我们的人口红利在消退。而企业面临的难题是什么呢?主要有三点:
第一,保持万人一致的高水准太难。如果是一家小店,其实很容易实现匠人精神,可以把小店的服务做的很好。但是变成10家店、100家店、1000家店的时候,没有谁能保证服务能够一致地实现高水平,这其中需要 大量的培训和完善的制度。
第二,保持长时间反复高水准太难。我们的展台上有一个机器人咖啡师,它能够模拟WBC金牌咖啡大师的手形去给你做咖啡。但是在咖啡界,如果一个咖啡师每天做超过30杯的咖啡,他就会疲劳,咖啡的质量就开始变的不稳定,而我们的机器人”豹咖啡”能做到,它可以保证这样的高水准。
第三,保持越来越好的服务、越来越低的成本太难。每个人都是“由俭入奢易,由奢入俭难”,当我们享受高水准的服务之后,对服务也是越来越挑剔,但是用人成本越来越高,所以这就是一个企业的难题。
大概3年前的时候,以色列的一个小团队利用AI技术做了一些功能,我觉得非常诧异。我离开360的时候开始做一款图片软件。后来发现美图也做了图片软件。有一天它推出了一个功能叫大眼睛功能。我们作为程序员和产品经理就很懵。我说我们都是把照片做的越来越真实,它怎么做的越来越不真实呢?
因为当时没有这样的AI技术,它要求用户用鼠标在自己的照片上点一下来放大眼睛。我说这个太low了,为什么不能找到用户的眼睛,系统自己放大?
然后我们就研究了很多的人脸识别的技术,例如Intel Open CV。我记得那个基础库只有60-70%的概率能找到眼睛,无论如何提高不上去,我们只好放弃了。
就在两三年前我就发现很多小团队做的产品,能够把人脸识别做的很好。后来我慢慢才知道,这背后有个东西叫AI技术。机器人界有一个词叫perception(感知),实际上AI是让机器第一次有了接近于人的感知能力,无论是语音识别还是视觉识别。它可以在某一个领域上、某一个应用场景上接近于人,甚至在某些点上超越人,这是一个非常大的历史契机。因为如果没有AI的话,摄像头记录的所有照片,在计算机里都是简单的0、1的字符串。只有当AI出现的时候,它才可以像我们一样知道这是一张人脸、这是一句话。
这就使得服务机器人产业有了新的机遇。
所以,机器人产业到底是一个什么样的形态?其实在AI之前,我们所有讲的机器人绝大部分都是一个机械化的工具,它很难有自主的感知能力,更多地是执行很多程序,很难跟环境发生真实的、自主的交互。
所以,在AI出现之前,我们谈的机器人多数是工业化的机器人,更多的是自动化的机器,去重复一个被高度定制的机器行为。只有当AI出现之后,我们才有可能使得自动化的机器从工业生产线走出来,奔向我们的生活场景。
生活场景是一个比工业生产线大十倍甚至百倍的场景,(在这样的场景中)机器人才能够在一个半开放的状态下跟人实现互动,用主动的感知为你提供服务。所以,这是一轮非常非常关键的历史契机。
二、机器人是跨界行业 AI+软件+应用+服务=机器人
我们没有机会在工业制造领域去和领先的企业去竞争,但是好处是什么?我认为由于AI的出现,使得机器人变成了一个非常跨界的技术。只有机械制造、有空气动力学是不够的,只有AI的技术也是不够的,除此之外还需要有互联网的应用。我把今天的服务机器人看成手机里的一个个APP,我并不认为今天会出现一个能到处跟着你去完成所有任务的机器人。
每一个APP就是一个垂直场景,用这个维度去思考你就会发现,用互联网的思路去重新考虑机器人,你可以给它找到很多垂直的场景应用,那么我们就有机会把用户体验、机械制造、人工智能结合起来,做成一个又一个垂直场景的机器人。
所以,这也是我自己的一个机器人公式,就是AI+软件+应用+服务才会等于机器人。今天在某一个维度特别突出的,未必能做出一款真正满足用户需求的机器人。我们今天在讲技术创新、黑科技,其实所谓的技术创新、黑科技的本质都是给用户提供服务。我自己并不算一个真正科班出生的技术人员,当我2002年进入互联网的时候,我就莫名其妙的得到了一个职位叫产品经理,今天想起来,那个职位在当时来说,应该是互联网第一批产品经理,我们并不懂产品经理应该干什么。但是我当时就在想用户到底需要什么?我怎么把这个技术包装成用户需要的样式?
因为当时遇到了一个最大的问题,就是做软件的同事能够写出很好的程序,但是用户不会用,后来我们才发现,原来用户需要才是最关键的。后来我自己做安全软件,在只有几个人的情况下,对抗几百人的传统杀毒公司,我们用了看似非常low的技术,但是我们快速地满足了用户需求,使得我们的安全软件在短短的两年内在中国有超过50%的覆盖率。
出去(做海外市场)以后,我们又做了猎豹清理大师这个工具APP,在美国提供下载,它看上去虽然是一个非常简易的应用,只是帮你把手机里的垃圾文件清理掉,让你空间变的更大,但事实上在全球广受好评。
所以,今天机器人一定要为用户提供真正需要的服务,把所谓的黑科技,变成一个非常简单使用的服务,而不只是一个技术参数。
由此,我们成立了一家叫猎户星空的公司,它专门负责打造AI全链条的技术,然后再由猎豹移动过去接近10年历史积累的用户体验,把他们结合起来,去打造真正有用的机器人。
三、自主研发 AI 全链条技术 致力打造真有用机器人
这里着重介绍一下猎户星空这家公司,为什么要介绍它呢?
后来我经过思考,猎豹移动当年在全球做出几亿月度活跃用户的时候,安卓和手机已经是一个非常成熟的生态系,只需要在上面做一个应用,就有可能让全世界的用户都去使用。但机器人不是,我刚才讲的AI+硬件+软件+用户体验,其实这里面每一个环节都很早期。
所以,这个时候,我很难在市面上找到一个符合需求的技术方案。所以当时我们就下定决心,根据自己的需要去定制所有的技术环节,使得组合起来能够变成一个在用户层面非常好用的产品,所以我们花了很大的力气去打造了语音识别、视觉识别、自主导航、机械臂技术。
当然这也是这个时代给我们的最大机遇,很多人问:你一个做移动应用APP的,怎么能够做深度学习?深度学习好像只有大公司才能做。我说恰恰相反,深度学习给我提供了一个弯道超车的机会。
在以前,感知学分为很多不同的专业、差别是非常大的,人脸识别、翻译、语音识别,每一个领域都要有专门的领域专家。但AI出现以后,使得这些看上去跨行业的领域变成了一个集中的底层,神经网络模型能够在语义识别、语音识别、人脸识别、图像识别(等不同领域)达到同样的效果。
所以,这就使得我们有机会用一个通用型的技术模型去解决在各个领域的感知问题。我们也是看到了这样的机会,就定义了机器人的“眼耳口鼻手脑”,然后在每一个环节打磨技术。在打磨的过程中,我们又想避免自己成为研发型公司,所以我们在每个领域都去推出了相应的产品,让用户去检验我们的技术是不是真的好用。
比如我们的人脸识别算法拿过好几个冠军,但这只能表明你模型的能力,这是不够的。我们在很多地方都场景落地,这正是互联网公司的优势,我们在全球有几亿的月度活跃用户,我们在美国有最大的第三方直播平台LiveMe,我们每天有几十万的用户在线直播,这直播里面其实都是人脸的数据,这使得我们的人脸识别效果能够很快的提升。
今天在猎豹自己的办公区,几千名员工,每天上下班、购物、会议室预定、公司会议都是刷脸识别。
然后我们还做了语音合成技术,就是TTS,昨天小米的小爱同学宣布月活超过3000万,小爱同学所有的声音都是我们猎户星空提供的,我们在这款声音上也是花了很大的力气。
其实语音合成不是一个特别高技术难度的产品,语音合成更需要你去尊重用户体验,但由于大多数公司很难去发表这方面的论文,所以他们基本上只是在用一个算法去实现。而我们用了大量的拼接技术、去一句一句的听,然后反复的调试,最后我们用语音合成了TTS—小雅的声音,非常温暖、会跟大家打招呼。我们由此相当于开发了一整套以语音为基础的OS。
大家可能不知道,今天美的音箱、喜马拉雅的小雅音箱以及我们自己的小豹AI音箱,包括小米音箱的大部分语音识别,都是用了我们猎户星空的语音识别能力,已经有超过千万的用户每天都在使用,而且我们接入了很多内容。
所谓的语音识别,它核心并不是一个所谓多么了不起的黑科技,它的核心是一个新的交互界面。乔布斯说过,每一次交互界面的变革,都是一次产业革命的机会。
所以,从键盘到鼠标到触摸屏、再到语音交互,其实它是一代又一代的交互革命。所以我极度看好类似于像智能音箱、包括咨询服务机器人(这些产品),因为它再也不需要用户在一个没有见过的屏幕上去触摸,用户只要用最自然的方式去表达,核心不是为了跟这个机器聊天,而是通过语音去获取想要的内容和服务。
然后我们还做了室内导航的技术,如果一个机器人不能够主动的移动就很难真正谈的上是一个机器人,它和一个Pad就没有什么本质区别,所以我们在这方面也下了很大的工夫。最重要的核心,不是它能移动,而是用很低廉的成本去移动,所以我们用了激光加视觉进行导航,我们的激光传感器成本大概只有几百元人民币,用了大量的算法优化使得激光和视觉能够配合,在室内的空间里能够自主的移动和避障。
所以,这是一个多模态的导航技术,仅有一个点是很难的,就包括今天视觉,解决不了所谓的大逆光问题,玻璃的问题,我们其实就是用多个和多种类传感器进行相互的融合。
我们还专门加强了机器人的麦克风阵列,因为我们认为一定要在嘈杂的环境中还能精准的听到用户的反馈。我们在这方面已经完全做到了高噪音下能够基本可用。虽然还不能说100%保证每句话都能听得懂,但对用户来说已经基本可用了,还有语义定义这些就不一一赘述了。
我们在321的时候在水立方发布了5款机器人,有的人说你为什么发布这么多款,为什么不像手机厂商一样只做一款?我说,就是因为这个行业处在很早期,我们很难像一个智能手机一样,通过一次大屏的革命,就能在不同的应用里都能满足需求。
所以,我觉得这时候需要一个化整为零的策略,在不同的垂直场景里提供不同的服务,让产品和用户一起去成长。当用户反馈越来越多的时候,你慢慢就能抓住真正用户的需求,从需求里能够抽象出相同的东西,让它变成统一的产品。
但在今天,我认为当前的机器人行业还很难推出一款类似于iPhone那样的产品,能够以这样一个产品的形式,就几乎满足用户对移动电话和智能电话的所有需求。所以这是我们要做好几款产品的核心原因。
这里面有我们主打的一款产品,叫『豹小秘』接待服务机器人。必须得承认,我当时特别希望它有一双手,能够端茶送水。后来经过我对整个技术细节不断考量之后,我认为今天有一双手可以给你端茶送水,还能自主移动的机器人过于复杂、成本过高。
今天带一双手的机器人原型产品还在公司里,但后来我们决定砍掉这双手,让它更聚焦。它真正核心的应用就是帮你提供服务,它能够像一个前台一样给你预定会议室,经过人脸的识别就可以介绍公司的历史,它可以像一个讲解员一样,在博物馆带着你走到每一个名画前面,去回答你关于这副画的提问,给你介绍这副画的背景。它可以像一个促销员一样,当你走过店面的时候,告诉你今天又有打折的信息。今天我们出了新的菜品,有没有兴趣品尝一下?如果你不愿意进店,它可以在这里告诉你,给你展示图片。
其实这样的需求,我认为是非常多的,我们把它定义成信息的咨询服务。今天有大量的工作岗位都在提供这样的服务,事实上这样的岗位很难保证服务水准的一致化。但是,机器人能做到。
我们每个人在讲机器人、人工智能、语音识别的时候,我们经常会看重它会出错的场景,因为各种感应器、摄像头、麦克风还不能够达到人眼和人耳水平。今天人工智能并不能像人这么动态的理解各种定义场景,在很多时候的确容易出错。但是,人工智能最大的好处在于它能保证一个标准以上就不会再掉下来,它可以保证不断的重复。
我们为了达到这一点,用了大量的传感器和芯片的组合,保证「豹小秘」在我们定义好的场景里能够实现高标准的交互和服务。现在猎豹移动已经开始用这台机器人取代前台。所以,每个用户来的时候,我们都能保证「豹小秘」在接待水准上的一致化。而且「豹小秘」已经在鸟巢的一个博物馆开始上岗,只要用户愿意扫一个二维码,它就可以带着用户去讲解每一副名画。
除了信息咨询服务之外,我们还在思考,有没有机会让机械臂从产线走到生活场景。因为我认为这是一个巨大的能够提供重复劳动的场景,以前走不出来的核心原因是什么?是因为它太贵了,我们都知道一只机械臂动则十几万、大几万的价格,它很难进入生活场景。
但我们反过来想,为什么它很贵?因为在AI出现之前,所有的机械臂的动作都要高度定制、快速。那时候我们对机械臂最高的要求是它的精度,因为它一旦到不了那个位置,就拧不了那个螺丝,拧不了那个螺丝会导致整条生产线停下来。
但今天由于有了AI,即便我们的误差稍微大一点点,我们可以在最后的时候让它重新做校正,这就是我们在做的一件事,我们在机械臂上加了一个摄像头,使得它能在最后的时候能校正自己的行为。将AI和机械臂结合起来,我们就可能用廉价的方案制造更多的机械臂,使得成本降下来。由于机械臂有了视觉能力,使得部署环境不需要那么苛刻。
我们今天做了一款机械臂,机械臂(在做咖啡的场景中)按取杯器的时候,它知道杯子掉下来没有,如果发现没有掉下来,它会再按一下、加大一点点力度,这就解决了以前在工业生产线上特别复杂的部署问题。所以我们非常有信心把这款机械臂的价格亲民化,使得它大量地完成重复劳动的工作。
我们为它做了一款(机械臂咖啡亭)「豹咖啡」,最近我们刚跟luckin coffee品牌合作,请了WBC的金牌咖啡大师去示范摇咖啡的动作。我们现在已经做到不需要编程,一个人做一个动作,机械臂就会完全根据这个轨迹来模仿动作。我们做了一整套关于学习运动轨迹和用很多子动作拖拽来完成一个复杂的机械臂运动的软件。这样有软件和AI,使得我们整个机械臂的运转变得更加容易。
所以,这也算是我们的口号,我们希望让每个小卖部都能提供五星酒店的服务,这在以前是非常难的,五星酒店之所以是五星酒店,就是因为它的服务高标准和一致化。
我认为一旦我们的产品能够在一个非常简单的垂直场景,实现用户满意度的话,它就可以大量复制。
我们也希望让每个乡村能够品尝到金牌大师的咖啡。在一些地方,连锁咖啡机构的最大难题就是招不到好的咖啡师,因为需要培训,还要面临高昂的人力成本,而我们的机器人只会越来越便宜,越来越普及化,让大家追求梦想的同时享受越来越好的服务。
最后说一句,希望我们能够做出真有用的机器人。我们不希望机器人只是一个噱头,或者是一个所谓的黑科技。它就是应该切切实实走在我们身边,帮我们提供服务。从一个小点开始,它就会慢慢变成和我们人类共同生长、生活的好伙伴。
我们也希望猎豹移动有机会可以和大家一起,助力中国服务产业升级,谢谢大家!