智能革命:迎接人工智能时代的社会、经济与文化变革
上QQ阅读APP看书,第一时间看更新

Internet的大会师

“深蓝”代表的计算机智能似乎与互联网无关,然而云计算和大数据的发展,使得人工智能和互联网终于合二为一,元神合体,获得了一种不同于“深蓝”时代的智慧模式。多芯片分布式计算加上人类积累的大数据,再通过超越决策树的新算法来贯通,体现了人类智慧与机器智慧的结合。

2016—2017年,AlphaGo(阿尔法围棋)横扫人类围棋高手圈。AlphaGo的下棋“思路”不同于人类,也不同于“深蓝”。简而言之,是千万盘人类围棋对弈的数据滋养了它。如果要给出更专业的解读,则可以说是蒙特卡洛搜索算法和基于深度学习的模式识别促成了AlphaGo的成就,其中最为重要的,恰恰是其前辈“深蓝”所不具备的深度学习。

根据各方的研究来看,AlphaGo不是自己想出棋着来,而是学习了人类高手的千万盘棋局(这就是大数据)。它记录下每个棋局中的每个局面,把上百万个局面当作输入进行训练,通过一个多层神经网络来预测人类高手会走出的下一着。经过巧妙的神经网络设计与训练,这个多层神经网建模了人类高手的“棋感”——对于当前局面,已知以往下棋历史中的胜率。在实际下棋时,计算机可以通过视觉识别记录下棋局,然后和以往的棋局数据比较,找到相同的模式(局面),再检索不同局面往后发展下去,根据以往下棋史中的胜率高低选出一些高质量的候选点供走子,而不必每个候选点都去尝试一遍,从而极大地减少系统运算量,不至于让系统“殚精竭虑”而死。这就像人类,不会穷尽所有候选点,而是根据经验和感觉选择某些点。选出几个点之后,人类还是要分别计算、比较哪个点更好。对于机器来说,这个计算就要交给蒙特卡洛搜索算法。

我们用一个不一定十分准确,但是形象的比喻来说明。蒙特卡洛树形搜索是对以往决策树算法的优化。对于以往的决策树算法,即便给了一个高质量的候选点,对于接下来的选择,它同样要进行穷举,在每个要选择的地方做一次分支,同样会遇到可选路径数量的指数爆炸。

蒙特卡洛方法就体现了概率学的精妙。假设在某个棋局局面下,深度学习网络给出了三个候选落子办法A、B、C,以这三个点为根节点,分别往下走子,可以想象成三棵树,每棵树还有无数分支。蒙特卡洛搜索不去穷尽所有分支,而是派出300万只蚂蚁分别从A、B、C出发,每个点100万只,飞速向树梢爬(也就是往下黑白棋交替走子直到决出胜负,基本上走200步就会分出胜负),总有部分蚂蚁走到最高点(也就是决出胜负,假设蚂蚁走到终点的情况代表黑子胜,没走到终点的情况代表白子胜)。

假设从A点出发的100万只蚂蚁有30万只到达终点,从B点出发的有50万只到达终点,从C点出发的有40万只到达终点,系统就认为黑子走B点胜率更高,就会选择B点。这就是概率学的取样算法,相比逐项穷举法,极大地缩减了计算量。

为什么派100万只蚂蚁而不是10万只或者1000万只?这是根据计算机的计算能力和对竞争对手的大致估计来确定的。如果派10万只蚂蚁就可以得到较高胜率,那么派10万只也可以。在相同时间内派出越多蚂蚁,对计算能力要求越高。

CPU芯片与GPU(图形处理器)芯片同时进行神经网络计算与蒙特卡洛树形搜索,模拟海量的终盘局面,这是人类计算能力无法相比的。由于采用深度学习建模了人类高手的棋感,看上去人工智能拥有了人类的大局观,而这个大局观恰恰蕴藏在人类高手的千万盘对弈数据里。

相信聪明的读者即便不太了解数学理论,也已经基本明白AlphaGo是怎么做的了,虽然具体的算法和策略要远比上面描述得复杂。AlphaGo向大众展现了一次当下人工智能/深度学习技术的发展水平。但实际上做同类研发的机构和人才很多,而且八仙过海,各显神通。

人类的行为一旦被互联网以数据的形式记录下来,就成为滋养人工智能在各行各业齐头并进,进而帮助人类自己的无穷无尽的燃料。机器翻译、语音识别、图像识别都是基于互联网提供的大量数据,用户点击行为也是如此。为什么百度搜索引擎的准确性是国内其他搜索引擎难以比拟的?因为数据量最大、算法最先进、积累最雄厚。用户的每一次点击其实都在训练搜索引擎背后的百度大脑,告诉它哪一条资讯才是用户最想要的。

当人工智能遭遇冬天的时候,人们认为机器很难像人一样思考,但机遇也正在这句话里。20世纪90年代以后,人类认识到人工智能没必要像人类那样思考,只要能够解决人类的问题即可。所以语言学家乔姆斯基在被问及“机器可以思考吗?”的时候,借用丹麦计算机科学家迪克斯特拉(Dijkstra)的说法反问:“潜艇会游泳吗?”潜艇不会像鱼儿或者人类那样摆动身姿游泳,但是它的水下能力非常好。

当我们回望历史——这个历史不仅仅是互联网的发展历史——整个人类工业发展都在孕育人工智能。凯文·凯利说过,蒸汽机活塞的自我往复运动就是一个精巧的设计,这种自我应答已经蕴含了“进化”的要素。自动化的追求是人工智能的进化动力。

比如,工业革命开始的时候,蒸汽机最先出现在煤矿和坑口。因为早期的蒸汽机效率低、能耗大,只有在煤特别多、特别便宜的地方才可能使用。采煤的时候会产生很多水,要从煤矿里面把水抽出来。有了这种需求,又有足够廉价的能源,才会想到用蒸汽机这种办法。一旦得以运用,蒸汽机的技术就不断发展,最终推动工业革命。人工智能也是一样:当你容易得到足够多的数据时,数据就是新的能源,就是燃料,有了数据燃料,人工智能的发动机就可以运转起来。

要感谢互联网的发展以及一切人类活动产生的数据记录,没有人类的数据积累,计算机就没有可学习的对象。要感谢那些人工智能探索者,他们并非都是计算机科学家,他们有的做生物学研究,有的做工程学研究,有的研究数学和计算机程序的自动迭代优化,有的改革计算机芯片的协作架构。各种研究成果汇流成海,终于汇聚成今天的人工智能。