人工智能也可以叫人造智能,是由人制造出来,当然,它是模仿人的一个智能。它肯定要通过一个载体表现出来,这个载体可以是机器人,也可以是一台计算机。人工智能有两个很重要的概念,大家不能混淆。一个概念叫做通用人工智能,或叫强人工智能,就是人工智能的系统,如果它的功能、能力和人是一样的,甚至超过人了,那就叫强人工智能系统。第二个概念叫专用人工智能,或叫弱人工智能,如果这个智能系统只能干一件事,尽管可能比人厉害,没关系,那它也是弱人工智能。比如说我们现在去乘高铁,以前还要检票,现在身份证往那儿一放,刷个脸你就进去了,这就是一个刷脸人工智能系统。语音识别也是同样的道理,不管它做得有多好,比别人强多少,如果它只是这一项功能的话,这就是一个弱人工智能系统。
出身“名门”
初露锋芒
突飞猛进
这三篇重量级的文章是谁写的呢?就是图上这三个人。第一个人叫辛顿,多伦多大学的教授,最能坐冷板凳的,研究神经元网络研究了一辈子,从最开始到成名就做这一件事;第二个人叫杨立昆,他不是中国人,他是美国人,是纽约大学的教授;第三位叫本杰奥,他是蒙特利尔大学的教授。这三个人在2006年几乎同时发了三篇重量级的文章,从不同的角度阐述了深度神经网络是可以起大作用的,是可以进行大规模学习训练的,只要输入的数据好,它就可以解决问题。换句话来说,我们今天人工智能的原型系统,很多人说就是神经系统。
那什么是神经系统?有一些我们叫做神经元,就是图片中那个红的、最中间那个核叫神经元。那边上绿的连进去的那些呢,我们把很多这种输入叫突触。然后它也有输出,那么我们现在要做的就是输入、输出和中间这个神经元,是不是有办法用数学把它模拟出来,或者说用数学把它描述出来,这个数学模型是有办法构建的。有了这个数学模型,这是一个神经元,神经元可以是一层的,也可以是N层的。所以有了数学模型以后,你就可以构造出这样的一个系统来,这样一个网络来。有了这个网络,你就可以通过演算,模拟仿真这样一个系统了。所以实际上,现在我们所说的这个深度神经网络,或者今天的人工智能系统,它的原型就是这个原型。
刚才我说的2006年那三位很有名的人发表了论文以后,大家先是高兴了一下,但是后面怎么样,那要看这个东西能解决什么问题,摸索了几年小有收获,但是并没有说,哇!这东西这么厉害。一直到2010年以后这件事才发生,和两个中国人有关系。一位是斯坦福大学的华裔女教授,叫李飞飞,另外一位是普林斯顿大学的华人教授,叫李凯。他们两个在2009年就是想弄一个规模特别大的图像数据库,而且标注出来,然后就拿这个数据库比赛。当时很多大学、公司都派代表队去比赛,那时候比赛比谁做的系统错误率比较低。2010年的时候,成绩最好的队是28%的错误率,下一年是26%的错误率。2012年的时候有了一个突破,错误率从26%一下子降到16%,性能一下子就提高了十个百分点。所有的人都很吃惊,说你到底用了什么招,你怎么能进展得这么快。这个参赛的领队是一个学生,说我也没用什么特殊的招,我就用了我老师给我的那个东西做了个网,然后就用这个网来参加比赛,没有什么,那东西我老师都发表过。那么他老师是谁呀?就是刚才说的那个辛顿,辛顿的学生拿着辛顿的这个东西来参加比赛,2012年第一次就打败了所有的对手,这是一个很了不得的大进展。
到了2013年的时候,就是深度网络一统天下的时候了,全是这个技术,没有别的,剩下就是使用多深的网,有多少个节点,参数怎么设定,这就变成了一些技巧性的东西,而不是方法上的革命了。所以这就是为什么说神经元网络突然一夜一统天下,开的都是神经元网络的花了。
到2015年有一个革命性的突破,它的错误率变成了3.6%,3.6%是什么概念?人的平均错误率是5%,这个系统的错误率3.6%,超过人了。在图像分类这件事上,神经元网络已经超过了人,那这事是谁做的呢?是一位中国人做的。我们中国有一位学者叫做孙剑,孙剑他当时带了一个团队,提出了一个网络,叫做残差网络。他拿这个残差网络去比赛,一举拿了个第一名。而且这个残差网络,不仅是在图像分类比赛里面拿了第一名,围棋比赛里面它仍然是最厉害的。大家都知道AlphaGo,它和李世石下的那五盘棋,它输了一盘,回去以后课题组就推演一下,复了一下盘,想弄清楚输的原因,结果发现是李世石走了一步棋谱上没有的棋。也就是说,每次AlphaGo和人下棋,如果人每次都走棋谱上没有的棋,那人就有很大的胜算。
那到底有多少棋是当时棋谱上没有的呢?后来他们一算,当时训练AlphaGo这个机器的棋谱占所有可能棋谱的20%。也就是说,当时的AlphaGo如果和人下棋,如果这个棋手他脑子真的够用,能记住哪步棋是棋谱里没有的话,那么他就有80%的概率获胜,这是很大的一个概率。
所以回去以后他们就说这不行,这个太容易被人击破了,怎么办呢?他们要重新设计AlphaGo的网络,然后他们就把原来的网络重新设计、提升,就是使用孙剑他们提出的残差网络。AlphaGo经过重新设计,从AlphaGo变成了Alphazero以后,那一个系统和人类棋手下棋就从来没输过,因为它把所有的棋谱上没有的棋全都生成出来,然后用一个完整的数据训练了系统。
在下围棋这件事上,应该说深度网络已经把这个问题解决掉了。基于这样的一个情况,我们对人工智能的判断,基本上可以这样讲,在深度网络适合的那一些弱人工智能领域,人工智能可以广泛进行应用、研究,做产品、做产业化。
从感知到认知,智能更上一层楼
类脑计算和量子计算,两条突破之路
如果做更大规模的或者和认知有关的人工智能产品,或者我们想做强人工智能,靠现有的计算机是做不到的,那怎么办呢?就要寻找出路,可能的出路有两个:在技术路线上面,一个出路叫做类脑智能。人其实还是很厉害的,我们一天消耗的能量,相当于一个20瓦灯泡的能量,但是我们要干的事,可是比一个巨型计算机还要厉害。人对信息处理的能效比非常之高,但现在的计算机不行,能效比太低了。我们就希望能找一个能效比更高一点的机器来做这件事,类脑计算能效比可能较高一些。另一个可能的技术途径就是量子计算。量子计算的能效比也极高,所以把量子计算做成比较稳定的一个系统也是有可能的。当然不管是类脑计算还是量子计算,现在还有很大的不确定性,到底什么时候能够做出来,像今天的计算机这么稳定、可靠、低价,这个还是需要去做很多研究的积累。
人与机器,混合智能具备独特优势
应用先行,有助于技术发展
未雨绸缪,防止技术失控
从2013年起,世界各国政府纷纷调研人工智能对社会、经济可能带来的颠覆性影响,相继发布符合自身国情的人工智能战略。2016年,美国连续发布《国家人工智能研究与发展战略计划》等三份重要报告;2017年3月份,日本发布《人工智能技术战略》报告,阐述了日本人工智能产业化发展路线图;10月份,英国政府发布了《在英国发展人工智能》报告,旨在推动英国成为全球人工智能领导者;2018年4月,欧盟委员会也发布政策文件《欧盟人工智能》,提出将采取三管齐下的方式推动欧洲人工智能的发展。如今,全球人工智能正处于加速发展阶段,世界主要国家都对人工智能进行系统性布局,目标直指第四次工业革命的全球竞争,在这场事关未来的技术革命中,我们的机会在哪里?优势和短板分别是什么?
中国人工智能的发展的优势与差距
人工智能总体上来说,在我们国家是非常受重视,从三个方面来看看中国在人工智能发展的一些大的情况。
我国已经成为人工智能领域的超级大国之一
四大优势护航中国人工智能发展
四个薄弱环节急需加强
我们也有一些短板,我们还有四个薄弱环节:第一个薄弱环节,我们在基础理论和原创算法这方面,我们得老老实实承认,还是有差距的。一个原因本身我们起步就晚,是后来者,好多的积累还是不够;另外加上这些年我们发展的速度比较快,萝卜快了不洗泥。对到底谁做得好、谁做得不好,有一些非常简单粗暴的人才评估体系,比如说就数你发了多少论文,拿了多少科研项目,对于那些长期做基础研究、肯坐冷板凳的人,客观上是不鼓励的。现在这个情况正在改观,一个是国家在加大投入,大学里面给年轻人的待遇越来越好;另外我们很多有实力的企业自己成立了研究院,在里面养了一批很强的年轻人,这些人工资给得很高。所以我相信再过五到十年,中国在人工智能方面的基础理论和算法一点都不会弱。
第二个短板是在高端器件方面,比如说利用GPU(图形处理器)做深度神经网络训练的这个芯片GPU(图形处理器)芯片,目前英伟达(NVIDIA)一家公司就占了70%的市场份额。中国真正自己的GPU(图形处理器)的生产厂商占的份额,还是比较低的。
第三个短板就是我们缺乏有影响的人工智能的开源开放平台。人工智能这几年能够发展这么快,和开源开放关系很密切。现在最好的算法有很多都开放了,源程序都在网络上,你从网上下载下来以后,根据你自己的应用稍微修改一下,马上你就可以做一个。现在我们经常讲笑话说,高中生可以和教授做同样水平的工作。但是最有影响的前五个平台,都是美国的企业,包括谷歌、亚马逊、微软、国际商业机器公司、脸书,这是五个人工智能开源开放做得最好的平台。
第四个短板是高端人才我们比较少。所以有统计说,中国最顶级的做人工智能的高端人才数量只相当于美国的20%,什么时候我们的高端人才数量和他们差不多了,我们的人工智能发展就基本上到位了。
未来已来,到底是哪一个未来到来了?我们来简单地预测一下。
先看过去三十年,这是一个变化非常大、非常快的三十年。第一个是计算机的算力,就是我们说的CPU,手机里核心处理器或者电脑里核心处理器,芯片的算力增强了一百万倍;第二个是存储,三十年前的台式机和今天的台式机里面的存储器相差了差不多一百万倍;第三个就是通信的速度增加了一百万倍,这个我们得益于光纤通信,得益于无线通信的发展。这三个一百万倍,使得过去的三十年我们周围的整个生活、社会、学习都发生了天翻地覆的变化。所以说下一次的工业革命将会在我们这些人的眼皮底下发生,那么大概是什么时间呢?在2030年到2040年之间会发生下一次工业革命。当然正确的时间和定义,那时候说不出来,可能要等到2050年、2060年,才能回过头说,那个时间点应该是第四次工业革命的起点。那么题目是什么?我个人的猜测,下一次工业革命的题目就是人工智能。人工智能将是未来一个世纪的核心技术,要想把人工智能发展好,我们就需要在很多事上进行一些好一点的布局。
国家战略、人才高地、基础建设、立法保障,一个都不能少
第一个是人工智能要作为一个全局的发展战略来布局,不管是国家、地方、企业,都应该把人工智能放在最重要的一个战略位置上。
第二个是怎么样健全人工智能的国家研发体系,这是今后人工智能发展很重要的一个布局。
第三个就是人才培养,必须要形成一些人工智能的人才高地。美国在人工智能发展的初期,其实它是有几个高地的,比如说斯坦福大学是一个高地,卡耐基梅隆大学是一个高地,MIT(麻省理工学院)和贝尔实验室那一带也是一个高地,这几个高地的形成,最后带动整个美国的人工智能理论和算法的发展。中国也应该形成几个人工智能人才高地,这样才有利于人工智能的发展。
第四个就是要加强智能化基础设施的建设,推动公开数据的开放、共享,这个也非常关键。这一轮的人工智能,主要是弱人工智能,如果你没有非常好的数据,你就谈不上人工智能,数据才是最核心的。但是为什么和政府相关的人工智能却起不来呢?因为它那个数据要么不放出来,要么它只放出来非常窄的数据。怎么样能让做人工智能应用的企业和团队,既能用到这些数据,同时这些数据又不失去它的隐私权、安全性等等,这就要平衡好这些东西。所以说,数据的开放共享,要制定出相应的一些法律法规,要有一些办法、工具可以操作。在这个前提下,一定要把数据尽快放出来,让相关企业用这些数据去做应用。
第五个就是人工智能法律伦理问题的研究应该要加强,要引导人工智能安全可控发展。另外一个,就是要深化国际开放合作,要主动参与全球的人工智能的治理。
数据处理、开源平台、应用场景,三个抓手要记牢
怎么样才能够真正地把人工智能的这些应用向各行各业赋能?抓手是什么?我觉得人工智能的抓手无非是三个方面:
一个是数据。没有数据,现在的弱人工智能都没法做。你要怎么样去把数据组织起来、清洗出来,另外再加上一些安全保护等等,所以数据是一个非常关键的抓手,我认为是排在第一位的。
第二位就是开源平台。作为一个人工智能大国,你应该要做出自己的贡献,所以基本上也会有一些有影响的平台出来,那样才能与你这个人工智能大国的身份相称,就是开源平台需要发展起来。
第三个就是应用场景。现在绝大多数都是投资驱动的应用场景,这个不够,政府必须要把优先发展的领域想清楚,通过市场经济就能做起来的事,那就交给市场去做;需要政府的手介入、干预才能做好的事,政府就要果断地开始去培育、去干预,而且要有手段。比如说网上有太多开源平台,到底哪个好用,针对哪个应用最合适,其实你让企业自己去做决定,他是不知道的。所以最好要有一些有经验的人,带着问题、技术和他们去进行对话,一直给它扶上马、送一程,然后这个应用就算成了。所以必须要抓应用场景,抓这种赋能,这是非常关键的一个步骤。我们需要做的就是要发挥各方的主观能动性,我们齐心协力把现在中国人工智能发展的短板补上,这个就是我们最需要采取的一个行动。在这个基础上,我们和全世界的人工智能同步推进,去迎接第四次工业革命、智能时代的工业革命曙光的到来。