“无监督学习”让AI更聪明

4时报独家

·裁员余波未了员工蚂蚁撼树
·“无监督学习”让AI更聪明
·探索火星、发力量子，中美以前沿科技叩开未来之门
·5G+医疗：

“无监督学习”让AI更聪明

成语投鼠忌器原意想用东西打老鼠，又怕打坏了近旁的器物。比喻做事有顾忌，不敢放手干。鼠年新解人工智能研发一方面大踏步进入“无监督化学习”的时代，同时又担心新技术会给AI应用带来新的伦理问题。
　　第三次人工智能浪潮以来，人工智能经历了从监督学习到无监督学习的演变。AlphaGo战胜了人类，但它是基于数以万计的人类棋谱学习而成；AlphaGo Zero以100:0战胜了AlphaGo，但它从未接受过人类棋谱，仅仅通过自我博弈（selfplay）、训练和评估，成功自学了围棋；其升级版本Alpha Zero，训练速度更快，在三天内自学了国际象棋、围棋和日本将军棋，面对三棋最强程序，在短短几小时内取得了不败战绩。
　　和AlphaGo相比，AlphaGo Zero、Alpha Zero最大的区别在于，并没有采用专家样本进行训练，经历了“监督学习”到“无监督学习”的进化。
　　按照学习方式，人工智能可分为监督学习、半监督学习、无监督学习。监督学习目的明确，需要带有标签的训练数据，效果容易评估；无监督学习目的不明确，无需带有标签的训练数据，效果不易评估。比如我们去看画展，虽然对绘画流派一无所知，但我们也会根据自己的感受，去把画分成不同种类，这就是无监督学习。半监督学习则介于两者之间。
　　虽然监督学习的效果不错，但是，收集和标记大型数据集的过程非常耗时、昂贵。在这方面，无监督学习无疑具有优势。因此，近年来大量人工智能的研究，纷纷转向无监督学习。
　　无监督学习需要训练算法生成自己的数据实例，但不是简单重现之前训练的数据，而是建立一个数据基础类模型。也就是说，不是生成特定的马或彩虹照片，而是生成马和彩虹的图片集；不是来自特定发言者的特定话语，而是说出话语的一般分布。
　　无监督学习的主要算法之一是聚类。我们在网购和浏览算法推送新闻时，有些产品就是无监督学习通过聚类来推荐的。系统会发现一些购买和阅读行为相似的用户，推荐这类用户最“喜欢”的产品。
　　无监督学习是当今计算机视觉领域最困难的挑战之一。英伟达通过利用生成对抗网络（GAN）及无监督学习两种深度学习技术，实现了场景间的四季转换，能够去除路旁的积雪、为干枯的树木补齐树叶，这一成果也被其利用在自动驾驶数据收集方面。
　　无监督学习的另一个应用是自回归模型。它把数据分成一系列小片段，每个片段依次被预测，通过连续猜测接下来会发生什么来作为输入，并能够再次生成猜测数据。在语言模型中，每个单词都是从它之前的单词预测出来的，它能够支持在电子邮件和消息应用程序中弹出的文本预测内容。
　　生成模型的出现，也让人们产生了一种担忧——它们会被滥用吗？虽然通过照片、视频和音频编辑操纵证据历史已久，但生成模型让恶意编辑媒体内容变得更加容易。知名案例便是deepfakes奥巴马演讲视频片段和ZAO软件。
　　虽然面临着伦理、隐私方面的挑战，但这并不能让人工智能科学家们投鼠忌器放慢脚步。相反，从另一层面来说，无监督学习更关注群体而非个人，人工智能在训练模型时，可以从对个体数据的收集和依赖转向对整合数据的分析和处理，从而起到保护用户个体隐私的效果。
　　未来，我们将跨入智能与伦理共存的崭新时代。
　　记者钱奕昀