IT时报 -V10 未来篇-
10未来篇
  • ·初窥AI版

机器算力如何向人脑靠近?

初窥AI版

“未来简史”

  

下一个“深度学习”是谁?
“人工智能和生物基因技术正在重塑世界,计算机和大数据将比我们自己更了解自己。”在2017年度“大众喜爱的50种图书”中,尤瓦尔·赫拉利的《未来简史》榜上有名,这本书以宏大的视角审视人类未来的终极命运:人类,正一步步进化为神一般的存在,开始复制自身,创造新的智慧生命体。
  人工智能是全球竞争的新焦点,而中国成为AI大秀的舞台。2018世界人工智能大会(WAIC)上,最新AI应用纷纷亮相,来自世界各地的学者、产业精英共同探讨AI产业发展,《未来简史》中未来人类与AI的变化,从这里可以一窥端倪。
  AI什么时候能进入2.0?AI下一代技术是什么?AI能和哪些行业结合共同探索世界?
  人类的未来已来,AI的未来尚需等待。IT时报记者吴雨欣郝俊慧 图东方IC
算法2.0:下一个“深度学习”是谁?
  半个世纪以前,麻省理工学院几个计算机系的教授第一次提到人工智能这个词时,他们以为人工智能是一个夏天就能解决的问题,但直到现在人工智能还是实验科学。2016年AlphaGo对弈让普通人意识到人工智能的魅力,其采用的深度学习方式在图像识别和语音识别领域的成功,让它几乎成为AI的代名词,短短两年,人工智能技术已经应用到自动驾驶、机器人、医疗诊断等多个领域,深度学习成为人工智能热潮的主力军。
  然而,深度学习的缺点也很明显:对数据和算力要求高,而最终机器给出的结论是“黑盒子”,人们只能知其然却不知其所以然。“大概五六年以后,深度学习的算法可能会到达增长极限。下一波AI创新应该来自哪里?”图灵奖获得者、清华大学交叉信息研究院院长姚期智在本次WAIC大会上提出了“姚之问”。
  如何回答“姚之问”?
深度学习的“高门槛”
  “能够引领AI发展的顶级人才,环顾全球尚不足千人,这让AI成为供不应求的抢手货,只有AI的应用门槛降低到普通开发者甚至是业务人员也能做的程度,才能够真正爆发。”第四范式的创始人戴文渊在WAIC上表示,据《全球人工智能人才白皮书》数据统计,目前全世界只有不超过1000家公司拥有能够开发AI系统的人才,与此同时,更多公司却拥有开发AI系统所需的数据。
  屡屡在国际语音识别大赛中夺魁的科大讯飞,对深度学习的优劣也深有体会,其董事长刘庆峰在WAIC的不同论坛上多次表示,“深度神经网络学习面临着算法突破的挑战,比如目前数据参数的设定都是手动,很多优秀的硕士、博士生只能将时间耗费在这种机械操作上,其次,深度学习对样本需求量过大,能否有少量数据就可以学习,而且目前深度学习很难突破有监督训练,未来能否变成半监督或者无监督训练?”
  刘庆峰指出的正是两个深度神经网络学习最难和最耗时的问题:处理数据格式化和培养深度学习模型,而这两个难题在某种程度上阻碍了AI的普及,因为数据、算力、建模都需要耗费大量人力和资本,普通企业根本无力“AI化”,而这恰恰也是斯坦福教授李飞飞希望倡导“AI民主化”的缘由。
算法突破:AutoML实现“AI的民主”
  从学界来看,迁移学习、冷扑大师、胶囊网络等等新的算法都有可能在接下来的几年中实现突破,但目前最早进入商业化、并且已经相对成熟的是基于迁移学习的AutoML。
  可以让机器自动建模、自动调参的AutoML被李飞飞称为“AI民主化的重要进展”,因为它大大降低了AI使用者的门槛,每个人都可以利用AI技术自动生成AI应用,将企业的数据自动变为模型,整个机器学习过程是自动化的。
  戴文渊以及第四范式的联合创始人、香港科技大学计算机系主任杨强都是迁移学习领域全球排名前三的科学家。
  戴文渊告诉《IT时报》记者,尽管在AutoML领域,微软和谷歌都在2017年发布了相关产品,但中国AI公司在这方面毫不逊色,前不久,国际人工智能顶尖学术会议NIPS正式宣布,第四范式击败了谷歌获得AutoML Challenge(挑战)2018大赛的承办权。
国产“AI操作系统”时机成熟
  戴文渊将第四范式的AI Prophet AutoML(以下简称“AutoML平台”)定义为“AI的AI”,开发者无需深入理解算法原理和完成大量编码训练,只需做到“收集行为数据、收集反馈数据、模型训练、模型应用”四步,便可以直接升级为AI开发者,这样一个公司AI应用的开发周期从以半年为单位缩短至周级别。
  或许将之比喻为“AI中的Windows”更容易理解,一家中小企业不需要去自己做一套Win-dows,而是在Windows上打开Office输入数据便可以得到自己想要的答案。但对于科技创新而言,从0到1的路走得最难,软件时代,中国国产操作系统半途折戟,AI时代,中国能有自己的AI“操作系统”吗?“操作系统能否成功,核心不在技术而是应用,软件时代,所有的应用软件也都来自国外,国产操作系统根本无力与Windows竞争,而AI时代,全球应用需求的中心在中国,我认为,国产AI操作系统的市场时机已经成熟。”戴文渊表示。
下一代人工智能要有推理能力
  为什么研究人工智能?基础科学不太接地气,澳大利亚科学院院士陶大程试图用更形象的语言让大家理解,他拿出一张画面满是人的照片问:谁知道照片中有多少人?会场近千名观众无人作答,有人下意识的开始去数,但通过人工智能技术,照片很快显示出答案,3秒中检测出920张人脸。“除了图片,现在的技术也能对视频中的人物做人脸检测、特征点检测,识别人与镜头的距离,甚至把视频的背景检测出来改成油画和中国画。人类通过眼睛看见这个世界,对周围的事物有迅速的判断和认知,如今我们做的是教机器如何变得像人类一样聪明。”陶大程的主要研究方向是表征学习,这也是人工智能领域非常重要的研究方向之一,包括多视角学习、多标签学习、多任务学习、迁移学习、张量学习、噪声数据学习等,这些研究成果被应用于计算机视觉、图像处理以及生物识别技术等领域。
  人工智能技术在向前行进过程中,总是遇到不同的问题,机器学习也像“盲人摸象”,看到某一部分,在已有信息的条件下做出最好的决策。“我们研究多视角学习,通过多个传感器拍摄同一个物体的不同状态,再汇总到一个平台做出选择。就像无人驾驶,有激光雷达、获取视觉数据的摄像机,获取听觉数据的麦克风阵列等非常多的传感器,之后把传感器信息最终结合起来做出判断。未来,能不能有一个上帝视角,让机器知道自己看到的是一个物体的不同角度?”陶大程希望通过多视角学习来改善这一问题,把一些不同源、不同表达方式的信息整合起来,以改善后续的识别问题。
  对于下一代人工智能具有什么特征,陶大程同样用一张图片举例,通过图片人物的着装和神情,人类一眼即可判别图片中的人在看球赛,“机器是能做到,但需要收集大量的信息才能教会它判断,这样的人工智能是我们需要的吗?不是!下一代的人工智能应该有推理能力,也只能是推理的时代。”