100笔趣阁

手机浏览器扫描二维码访问

第六章 暗知识神迹机器能否超越人类(第1页)

一秒记住【xiaoyanwenxue.com】精彩无弹窗免费!“罗辑思维荐书集锦(套装共24册)(.shg.tw)”!

第六章暗知识神迹——机器能否超越人类

导读

AI的作用将不止于颠覆商业,还会有更深刻和长期的影响。本章负责开脑洞,理解了本章就能知道下一代该如何做好准备。这一章也可以直接跳进来读,但最好能先读前两章。

我们在上一章描述了AI在短期内会对商业和生活造成的影响,但我们很难想象更长期(30~50年)的影响。虽然预测长远的未来很难,但是如果能深刻理解AI的本质,就能对未来的方向有感觉。2007年苹果手机的发布开启了移动互联网的一波巨浪,当时对移动互联网有两种不同的观点。一种观点认为移动互联网和个人电脑互联网有完全不同的性质,会出现全新的杀手级应用。另一种观点(主要是个人电脑互联网的部分大佬)认为手机无非是个人电脑的延伸,比原来的网站、搜索和游戏等多了一块显示屏幕而已。笔者是中国最早从事移动互联网的专业人士,基于手机和个人电脑的本质区别在于手机的定位功能,笔者曾经预测未来杀手级应用一定和定位功能有关,而且不会是当时大家都能想到的找加油站、订餐馆这样的“浅层定位应用”,也一定会产生新的巨头。果不其然,出行类的应用成为移动互联网的杀手级应用,创造出了Uber、滴滴出行这样的个人电脑互联网巨头之外的新的移动互联网巨头。

基于深度学习的AI本质

数据之间相关性的发现和记忆

读过第三章的读者能体会到神经网络最本质的特点是发现并记忆数据中的相关性。例如,看了很多汽车的图片后就会发现汽车都有四个轮子。人的大脑对图片这类直观的数据间的相关性也能发现一部分并记住,这就是默知识。但当数据量很大,又不直观时,例如股票市场的数据、复杂系统(例如人体、核电站)内部的数据,人就不行了。而神经网络却应付自如,一眼就能发现数据之间的关系并记住,这就是暗知识。下回再遇到类似的数据,马上就能做出判断。随着神经网络的规模增大(神经元数目和神经元之间的连接数目),机器能够处理人根本无法企及的大规模的复杂数据。

海量记忆基础上的细微差别的识别

机器学习需要大量的数据,主要是让机器“看到、记住”数据中呈现出的各种模式。有点像小孩玩万花筒,数据就是装入万花筒中的彩色玻璃碎片,不停地转动玻璃棱镜就是不同的算法(对应神经网络中不同的连接)。一组有限的数据中埋藏着无数排列组合出来的图样。因为机器的记忆比人的记忆准确,而且量大,机器可以每秒转几亿次万花筒,很快就能看完并且记住所有的图样。所以机器学习可以发现数据中隐藏的所有细微区别。

基于以上原理,机器学习适合做极其复杂的决策,例如制定像健康保险这样极其复杂的公共政策,策划诸如诺曼底登陆这样包含大量变量的军事行动。

这两个AI的本质其实也正是暗知识的两个特点。基于以上两个特点,我们看看未来会出现哪些远超人类的颠覆性的超级应用。

科研加速

一个科学研究的过程可以分为以下几个步骤。

(1)提出问题或选择要解决的问题。

(2)学习研究关于这个问题已经发表的研究文献。

(3)根据研究文献和研究者的经验提出假设。

(4)设计验证假设的实验。

(5)进行实验和整理实验数据。

(6)根据实验结果判断假设是否成立。

(7)如果假设不成立,返回第(2)步或第(3)步,提出新的假设。

在这个流程中最花时间的有三个环节:研究文献、做实验和整理数据。在这三个环节中,机器学习都可以部分甚至全部取代人。获取相关的文献,阅读、理解并总结已经成为科研的瓶颈之一。根据渥太华大学的研究,自从1965年以来共有5000万篇科学文章发表,现在每年新发表的文章是250万篇。关于某个能够抑制癌细胞的蛋白质的论文就达到70000篇。一个科学家即使一天读10篇文献,每个工作日都读,一年也只能读2500篇,所以大部分的研究结果都会被束之高阁。使用AI可以通过自然语言理解找到相关的所有文献。例如一个叫作Iris(艾瑞斯)的AI软件可以这样做科研:首先从一个关于这个研究题目的演讲开始。这个演讲通常是本领域的一位著名科学家做的几十分钟的概述性报告,例如TED(美国著名讲坛)大会的演讲。Iris先使用自然语言处理算法分析演讲的脚本,挖掘从开放渠道获取的学术文献,查找到与讲座内容相关的关键论文,然后将相关的研究论文分组并进行可视化,Iris目前可以达到70%的准确率,下一步是用人工帮助标注文献使机器匹配精度增加。当机器能够理解文献的内容和结构时,至少可以帮助科学家总结出在一个科研领域中已经提出的问题,已经提出过的假设及其验证,已经做过的实验和结果。机器甚至能根据文章的逻辑自洽性对文章结果提出疑问。用机器阅读文献的一个重要作用是能够对前人的工作一览无余,不至于做许多重复性的工作。

今天的科研越来越依赖于实验,而实验的准备、操作和数据整理经常耗时耗力。机器学习可以大大加快实验进程。2001年的诺贝尔物理奖颁发给了美国的埃里克·康奈尔(EricCornell)等三位实验物理学家。他们的成果是用激光器和磁场创造出了自然界不存在的物质的第四种状态:玻色-爱因斯坦凝聚态。物质在自然界的三种状态根据温度不同分别是固态、液态和气态。当温度降低至非常接近绝对零度时(实验上永远无法达到绝对零度),物质就会进入凝聚态(一种气态的、超流性的物质状态)。凝聚态物质有很多特性,例如对地球磁极和引力场极为敏感,光线在该物质中会延迟,等等。基于印度科学家玻色的计算,爱因斯坦于1924年预测了这种物质的存在以后,科学家一直想在实验室验证出来。1995年,这三位科学家经过多年的实验,用一套非常复杂的实验装置终于制造出了物质的凝聚态。图6.1是这个实验的示意图,透镜内有一小块物质,透镜外有许多激光束。激光打在物质上可以约束物质内分子的运动,从而降低物质的温度。图6.2是实验设备的核心部分,图6.3是实验设备的全貌。可以看出,这套实验装置非常复杂,可以设置的参数非常多,如果每一种参数的排列组合都去试,到宇宙终结可能都试不出来。而人有许多直觉可以大大加快实验。获奖的三位物理学家摸索了很多年才终于造出了凝聚态。2016年5月17日,来自澳大利亚新南威尔士大学和澳大利亚国立大学的研究团队使用机器学习从头开始操作这样的实验(反复设置调整实验设备的各种参数直到产生凝聚态物质),机器学习竟然不到一个小时就成功制造出了这种凝聚态物质。该团队希望通过进一步借助AI以更快的速度构建更大的这类物质。

图6.1凝聚态设备示意图:不同方向的激光束约束分子运动造成凝聚态物质(腔体内)

图片来源:https:plato.stanford.eduentriesphysics-experiment。

图6.2凝聚态实验设备的核心部分

图片来源:https:plato.stanford.eduentriesphysics-experiment。

图6.3凝聚态实验设备全貌

图片来源:https:plato.stanford.eduentriesphysics-experiment。

科学实验的第三个环节是收集整理数据,这更是AI的优势。其实在科学界目前还有一个瓶颈就是研究论文的审核,要发表的论文太多,能有水平和时间对其进行审核的人太少。机器学习可以大大加快这个过程,例如可以检查该论文是否抄袭或者和已经发表的结果有冲突等。

科学研究中最难被机器取代的是提出假设,但是IBM的一个团队宣称他们的系统可以做到。也就是说,他们的AI可以通过挖掘学术文献自动产生科学假设。而且,宣称他们的算法可以用来做出新的科学发现。他们的目标是将文本挖掘与可视化和分析结合起来,以便识别事实,并提出“新的、有趣的、可以测试的、可能是真实的”假设。

人类过去500年来的进步主要依靠科学技术的进步,而且这种进步还在加速。随着AI的发展,科学发现可能会加速,这意味着技术进步会进一步加快,反过来又会加快科学的进步。例如量子计算依赖于材料科学的进展,一旦量子计算取得突破,计算能力就可能比现在提高几个数量级,AI能力的提高又会进一步加快科学进展和加速实验速度,如此循环下去。

另外一个加速是用AI改进AI。谷歌和Facebook都开始研究自动机器学习,通过强化学习的模型,让机器不仅不断地调整参数,而且能够选择不同的神经网络模型。在很多情况下自我学习的性能都可以和人设计出来的性能相比,机器有时还会选择人类想不到的模型,甚至有人开始探索如何在机器学习里模仿人类的想象和创新。2017年底,谷歌推出由AI自主“孕育”出的“子AI”,该“子AI”被取名为“NASNet”,研究人员在ImageNet图像分类和COCO目标识别两个数据集上,对NASNet进行了测试,在验证集上的预测准确率达到了82.7%,比之前公布的人工智能产品的结果好1.2%,效率也提高了4%。目前这些研究还处在早期阶段。一旦这类循环加速技术成熟,就会使技术迅速达到一个新的高度。

科学的本质是受控实验。人类通过控制一组变量(例如物理实验中的物体位置和受力等,化学实验的温度和压力等)来测量另外一些变量(例如物理实验中物体的速度,化学实验中的气体体积)的变化。科学定律就是可控变量和测量变量之间的关系。当人类完全掌握了某一类关系后,就可以通过制造仪器把原来的测量变量变为可控变量,用增大的可控变量集再来继续发现它们和新的测量变量的关系,这就是科学进步的本质,所以仪器就是某一类科学定律的物化。科学的进展完全依赖于能否完全掌握某个科学定律并且把该定律变成仪器。所以科学的进展可以分为三个步骤。

(1)提出假设:某一组可控变量和另一组可测量变量可能的关系。

热门小说推荐
网游之龙王苍傲

网游之龙王苍傲

一个重生的天才,一段关于网游的传奇。他强大,装备技术和奇遇一个不缺。他仁慈,百花齐放比一枝独秀更能渲染这个精彩的世界。他残忍,龙之逆鳞绝不能触动。他聪明,智慧是一种力量。他虚拟的世界可以成为每个人的梦想舞台,打宝练级PK竞技等等组成了这个世界的节奏。正如足球运动是足球运动员不可缺少的部分一样,游戏,也是我们玩家的第二生命!你喜欢玩游戏吗?...

都市小世界

都市小世界

天降小世界,幸运的李青云不但得到了小世界,还得到了神尊传承,从此李青云走上了如果发展小世界的道路。...

龙行天下

龙行天下

少年富则国富!少年智则国智!少年强则国强!少年称王则国称王!...

修仙奶爸的妖孽人生

修仙奶爸的妖孽人生

小朋友,千万别惹我,我老爸超凶的!小娜扎。九天之下大境,皆为我界!孟浪淡淡道想要嫁给我,那得看我女儿喜不喜欢你!...

这个NPC太凶猛了

这个NPC太凶猛了

穿越到游戏中的魏晋,赫然发现自己竟然成了一名,只能沦为玩家经验值的底层NPC。想象到自己未来的处境,魏晋怒上心头,当即心一横,举起斧头就砍了玩家。爷不伺候了!只是,当他破罐子破摔,占山为王,准备自此逍遥自在时,却听到一则令他张目结舌的消息。我都落草为寇了,你告诉我这里是三国?PS前期发展势力,后期争霸,凭借横...

我在末日当领主

我在末日当领主

末日来临,丧尸横行,昔日的同伴变成恐怖的怪物,物资匮乏同类相残。林昊觉醒了异能,旁人避之不及的,在他眼里通通成了宝贝。叮,发现异变丧尸猫耳娘,是否契约?叮,发现进化期异变怪兽雷电蝠龙,是否契约?叮,发现觉醒异能人,是否契约?别问,问就是全都要!当别人还在争夺物资女人的时候,林昊已经左拥右抱,打下一片江山了。...

每日热搜小说推荐