IT时报 -V4 时报独家-
4时报独家
  • ·裁员余波未了 员工蚂蚁撼树
  • ·“无监督学习”让AI更聪明
  • ·探索火星、发力量子,中美以前沿科技叩开未来之门
  • ·5G+医疗:

“无监督学习”让AI更聪明

  

成语投鼠忌器原意想用东西打老鼠,又怕打坏了近旁的器物。比喻做事有顾忌,不敢放手干。鼠年新解人工智能研发一方面大踏步进入“无监督化学习”的时代,同时又担心新技术会给AI应用带来新的伦理问题。
  第三次人工智能浪潮以来,人工智能经历了从监督学习到无监督学习的演变。AlphaGo战胜了人类,但它是基于数以万计的人类棋谱学习而成;AlphaGo Zero以100:0战胜了AlphaGo,但它从未接受过人类棋谱,仅仅通过自我博弈(selfplay)、训练和评估,成功自学了围棋;其升级版本Alpha Zero,训练速度更快,在三天内自学了国际象棋、围棋和日本将军棋,面对三棋最强程序,在短短几小时内取得了不败战绩。
  和AlphaGo相比,AlphaGo Zero、Alpha Zero最大的区别在于,并没有采用专家样本进行训练,经历了“监督学习”到“无监督学习”的进化。
  按照学习方式,人工智能可分为监督学习、半监督学习、无监督学习。监督学习目的明确,需要带有标签的训练数据,效果容易评估;无监督学习目的不明确,无需带有标签的训练数据,效果不易评估。比如我们去看画展,虽然对绘画流派一无所知,但我们也会根据自己的感受,去把画分成不同种类,这就是无监督学习。半监督学习则介于两者之间。
  虽然监督学习的效果不错,但是,收集和标记大型数据集的过程非常耗时、昂贵。在这方面,无监督学习无疑具有优势。因此,近年来大量人工智能的研究,纷纷转向无监督学习。
  无监督学习需要训练算法生成自己的数据实例,但不是简单重现之前训练的数据,而是建立一个数据基础类模型。也就是说,不是生成特定的马或彩虹照片,而是生成马和彩虹的图片集;不是来自特定发言者的特定话语,而是说出话语的一般分布。
  无监督学习的主要算法之一是聚类。我们在网购和浏览算法推送新闻时,有些产品就是无监督学习通过聚类来推荐的。系统会发现一些购买和阅读行为相似的用户,推荐这类用户最“喜欢”的产品。
  无监督学习是当今计算机视觉领域最困难的挑战之一。英伟达通过利用生成对抗网络(GAN)及无监督学习两种深度学习技术,实现了场景间的四季转换,能够去除路旁的积雪、为干枯的树木补齐树叶,这一成果也被其利用在自动驾驶数据收集方面。
  无监督学习的另一个应用是自回归模型。它把数据分成一系列小片段,每个片段依次被预测,通过连续猜测接下来会发生什么来作为输入,并能够再次生成猜测数据。在语言模型中,每个单词都是从它之前的单词预测出来的,它能够支持在电子邮件和消息应用程序中弹出的文本预测内容。
  生成模型的出现,也让人们产生了一种担忧——它们会被滥用吗?虽然通过照片、视频和音频编辑操纵证据历史已久,但生成模型让恶意编辑媒体内容变得更加容易。知名案例便是deepfakes奥巴马演讲视频片段和ZAO软件。
  虽然面临着伦理、隐私方面的挑战,但这并不能让人工智能科学家们投鼠忌器放慢脚步。相反,从另一层面来说,无监督学习更关注群体而非个人,人工智能在训练模型时,可以从对个体数据的收集和依赖转向对整合数据的分析和处理,从而起到保护用户个体隐私的效果。
  未来,我们将跨入智能与伦理共存的崭新时代。
  记者钱奕昀