IT时报 -V6 特别策划-
6特别策划
  • ·“玄学”深度学习之惑:

“玄学”深度学习之惑:

打不破的“炼丹炉”黑盒子

国际人工智能联合会议理事会主席、香港科技大学教授杨强

  

IT时报记者郝俊慧刘慧莹
Artificial Intelligence(人工智能,简称AI),这个词诞生于上个世纪50年代,1956年在达茅斯会议上被提出后,经历过几起几落,直到最近几年,基于神经元网络结构的深度学习突然被发现在语音识别、图像识别上有特别功效,谷歌、亚马逊等互联网公司纷纷推出自己的人工智能战略,Alpha Go打败了李世石,AI才正式进入快车道,而且似乎这一次,再也不会停下往前奔跑的脚步。
如今,人类将自己的未来放到了技术手里,无论是让人工智能更像人类思考的算法,还是让机器人大脑运转更快的芯片,都在向奇点靠近。谷歌工程总监、《奇点临近》的作者库兹韦尔认为,一旦智能机器跨过奇点,人工智能的发展将进入加速喷发状态,可以与人脑相媲美,甚至比人脑更具可塑性的“仿生大脑”终将出现。
究竟有哪些技术能够推动AI迈过这个奇点呢?在本期专刊中,《IT时报》记者采访了全球AI界的顶尖技术“大咖”:“德扑AI之父”卡内基梅隆大学教授托马斯·桑德霍普,迁移学习“掌门人”香港科技大学教授、国际人工智能联合会理事会主席杨强以及“胶囊网络”最好的解读者Aurélien Géron,试图寻找能推动AI迈过这个奇点的技术引擎。
源起
2018年初,一个来自伯克利大学、阿姆斯特丹大学、MPI for Informatics以及Facebook的人工智能研究部门开始向人工智能传授自我判断和解释的能力,试图让“黑盒”变得透明。这已经不是人类对深度学习黑盒子探索的首次尝试,但至少说明人类对黑盒子的解释正在不断努力。
深度学习的可解释性,是一个至今无人能解的问题。中国科学院计算技术研究所的在读博士王晋东告诉记者,即使一些机构试图对黑盒子内部进行可视化操作,把神经网络的每一层都输出,但普通人也很难理解这些复杂的结果,“深度学习如同一门玄学,是‘炼丹’的技艺,而黑盒子就像一个‘炼丹炉’。对于这个‘炼丹炉’来说,画出内部图像没有任何指导意义,因为无法解释神经网络为何这样设计。”
黑盒子,顾名思义,就是内部结构不可探视的密闭空间。对于深度学习研究者来说,层层叠加的神经元网络结构使程序在经过几千万个样本训练以后,对输出的结果无法解释。也就是说,一旦程序输出结果有错,人们无法知晓是哪里出了错,应该调整什么地方。
人工智能正处于初始阶段,香港科技大学教授杨强告诉《IT时报》记者,因果关系非常重要。在很多实际领域中,如果一个计算机模型只给出结论,但人类并不知道这个结论如何得出,往往这个模型不会被实际使用。
事实上,Alpha Go成功背后存在非常多不可解释的“隐患”,在不少科学家眼中,这种成功只能证明,人工智能在解决包含以下四种特点的问题时,能够做到甚至超过人类的水平:1,有充足的数据(或知识);2,完全信息;3,具有确定性;4,单领域。当一个问题不满足上述4个条件中的任何一个时,都将给计算机带来显著的困难。所以当Alpha Go以4:1输给李世石时,人们想知道深度学习在估算棋盘时哪一个地方出了问题,却没有办法回溯。
杨强认为,让黑箱模型具有可解释只是人工智能未来的一个方向。在未来,人工智能还身兼太多重任——让机器学习更快速更可靠、使机器实现自动推理、使预测更远更精准,使机器能够理解人,能够观看和收听影像……也就是说,让机器具有人的能力,在人不想做的领域都能超过人,但这个阶段还有相当长的时间。
因此,在主流的深度学习和卷积神经元网络结构之外,人工智能领域还在尝试许多其他方向,科学家们希望通过不同的技术路径,可以用更小的成本、更快的速度实现人工通用智能。当这些源自不同“山头”的技术汇聚成海时,或许技术爆炸的奇点就到来了。
迁移学习:
批量生产“小而美”的AI公司
数据缺失、算力有限,很多公司在解决AI可移植问题和普适性问题。试想当你学会中英文互译,就可以将翻译的法则同时运用在中法互译当中;当你学会骑自行车,也就同时具备了驾驶摩托车的技能……这就是迁移学习的初衷,利用更低成本实现更多功能。在大数据成本居高不下、小企业无力弯道超车的人工智能领域,迁移学习或将成为颠覆现有格局的下一个技术风口。

让机器学会举一反三
  《论语·述而》曾有云:举一隅不以三隅反,则不复也。正如物理学家开尔文通过巴斯德高温杀菌的发现,延伸出低温存储的“冷藏工艺”,举一反三能够帮助人类解决生活中各种各样的问题。而这种举一反三的能力在机器学习领域同样适用,科学家将其称之为“迁移学习”。
2009年,新加坡南洋理工Sinno Jialin Pan和香港科技大学教授杨强在一篇调查中首次提出人工智能领域“迁移学习”的概念。杨强是首位也是至今为止唯一的AAAI(美国人工智能协会)华人执委,同时也是第一位担任IJCAI(国际人工智能联合会议)理事会主席的华人科学家。这位AI牛人对“迁移学习”技术的研究直指人工智能发展的痛点——用于支持机器深度学习的基础大数据往往未经标注,收集标注数据或者从头开始构建模型代价高昂且费时。
机器学习是人工智能的核心,卡内基梅隆大学人工智能教授Tom Mitchell曾定义机器学习为“对能通过经验自动改进的计算机算法的研究”,即机器通过对大量数据和过往经验的学习,提升计算机程序的性能。杨强告诉记者,在这个过程中,机器内置的模型往往已经人为预测好,但是如果未来有所变化,这个模型就会无法扩展,迁移学习意在使模型具备可扩展性,增强其范化能力。也就是说,迁移学习可以使机器学习通过更低廉的数据成本,解决更广泛的问题。
商业倒逼技术,致力于通过AI实现广告投放的品友互动是一家“大数据+人工智能”公司,其CTO欧阳辰告诉记者,对于人工智能企业来说,一定是先有商业场景再有技术,AI只有在合适的商业场景中才能立足。欧阳辰认为,在一些独特的场景里,AI正尽可能小型化,而对于数据缺失、算力有限的中小型企业,解决AI可移植问题和普适性问题是当务之急,迁移学习恰好是一剂良药。利用迁移学习通过已有的数据和模型对新数据快速建模,成为小公司弯道超车的下一条可能的路径。而迁移学习应用可预见的广泛性,也使这门技术成为当前学界炙手可热的课题。

实现不同场景AI模型再利用
  迁移学习之于深度学习,就好比通过节约用纸保护森林。在人工智能领域,当模型具备一定可扩展性,就能反复被“回收利用”,减少不必要的数据成本。“回收利用”的想法十分诱人,而在现实应用当中,表现也并不逊色。
杨强告诉记者,迁移学习已经在现实中很多领域应用广泛:人类可以通过建立语音识别模型,将对普通话的深度学习模型迁移到方言;也可以建立起人脸识别模型,将光照很好状态下的模型迁移到不同光照场景;甚至可以实现不同领域、不同背景下的文本和舆情分析。
在应用最为广泛的金融场景下,销售经理在推销信用卡前需要对产品和客户做出刻画。银行可以运用传统的深度学习解决目标用户的筛选问题,即通过用户在银行的历史数据,通过模型筛选得出目标名单。但是如果转换到房产推销领域,恐怕原有的模型将不再有效。
买房是大额消费,基础的用户数据不够多,而且稀缺数据的收集成本更加高昂,这样房地产推销的精准用户很难得出。好在迁移学习为这类问题提供了解决路径——找到信用卡推销与房产推销之间的相似性,利用模型迁移在采纳商家信用卡建议的用户中,寻找新的买房趋势,实现商业目的。
在大数据甚嚣尘上的数字化时代,基于大数据深度学习下的人工智能并不能满足所有细分场景,更何况“大数据”并非轻易得来。杨强认为,如何用少量数据实现同样预测效果,即“迁移学习”,将会是人工智能中一个未来的发展方向。而在迁移学习技术面前,中国平行于世界先进水平,甚至走在世界的前端。
杨强在2017年7月CCFGAIR(全球人工智能与机器人峰会)的演讲中曾提到一个愿景——利用迁移学习,即使是自身没有条件获得大量训练数据的小公司,也可以按照自己的需要应用大公司训练出来的模型,从而普及AI的应用。或许公司小而美,技术精而尖,将是人工智能公司的下一个发展方向。