IT时报 -V3 特别报道-
3特别报道
  • ·AI看得“懂”的10亿张脸
  • ·无人码头的“中国芯”

面向复杂场景的人物视觉理解技术及应用

AI看得“懂”的10亿张脸

  

科技进步特等奖
  支付、健康码、门禁、取快递……当越来越多的场景应用人脸识别,似乎很少能感受到它的“科技感”,它会进入“休眠”吗?
  不会!因为有更多复杂的场景需要更聪明的人脸识别。
  获得此次上海市科技进步特等奖的《面向复杂场景的人物视觉理解技术及应用》项目由上海交通大学特聘教授马利庄主持,这项历时近10年的研究构建了复杂场景下的人物视觉理解创新应用平台,让人脸识别在一些复杂场景中大有作为。
首创光线活体认证
  从几十到几百、几百到几千、几千到上万新冠患者,封城、居家办公、线上教学……疫情彻底打乱了生活节奏,而改变得益于一个小小的健康码,逐步让生活恢复正常。
  健康码蕴藏着怎样的奥秘?马利庄介绍,腾讯健康码应用了该项目的核心技术,用户登录验证时,需进行光线活体检测和人脸比对,通过后才能获得健康码,以此保障用户身份真实性,基于光线活体的远程身份核实是健康码的核心技术。“以前活体认证需要用户做一些动作,现在用随机光线进行检测,用户不需要摇头、不需要动,只需对着屏幕就可以了,这也是国际首创的活体认证”。
  截至2020年12月中旬,腾讯健康码累计亮码超200亿人次,覆盖10亿人口。
  在腾讯优图,进入门禁系统,不需要脱口罩,哪怕用手捂住半张脸,只要人脸录入过系统,也能被识别。《IT时报》记者在测试中看到,测试员戴上口罩或者用手捂住下半部分脸,系统都识别出了他。“系统识别的是人脸上一些不变的特征,这也是这个项目的创新点之一,可以在戴口罩、复杂姿态、物体遮挡等环境下进行识别。”马利庄说,疫情期间,在一些特殊场所,如果人们不愿脱下口罩,也可以顺利通过。
  目前,这个项目的一些关键技术18次刷新了世界纪录,在人脸检测、人脸检索、人体姿态估计等方面都达到了世界领先水平。
“大海捞针”比对更精准
  如果说单个个体的识别相对比较简单,那么“大海捞针”式的比对则更考验人脸识别的“智商”。
  以前,很少有银行支持远程开户,但微众银行等互联网银行就可以,微众银行的第一笔互联网银行放贷业务是一位出租司机通过远程人脸识别获得了3.5万元的贷款。
  这也依托于项目组构建了国际首个在银行系统商用的人脸远程核身系统,这也意味着,人脸远程核身技术达到金融级的安全要求,目前通过率超过99%。
  生物识别技术有很多种,要融合多元特征,例如脸部表情、声音、人脸特征,提高身份远程核身的可靠性和准确率。
  在马利庄看来,人脸识别技术的挑战与难点主要是图像的采集质量,其次是光照环境和姿态。“金融支付时,人会主动配合采集设备,图像质量和人脸姿态好,识别率可以达到99%。但很多时候,人脸会在不同的光照条件下,产生大的差异,姿态也各异;还有年龄跨度问题,随着年龄的增长,脸部也会发生变化。”马利庄说,项目组形成了全流程人物视觉理解技术体系,可以对人物行为和细粒度表情进行分析,也可以对密集人群中的人体姿态进行实时高精度分析。
  跨年龄人脸识别技术也是项目组和腾讯优图合作的结果,在仅有几张婴幼儿阶段的模糊照片情况下,提取人身上不会改变的特征,毫秒级时间内便可完成千万级人脸检索,大大提高了走失人口匹配的精准度和速度,协助寻回15名被拐10年以上儿童。
  跨年龄段识别是学术界的一大难题,尤其是对于在婴幼儿阶段就走失或被拐的孩子来说,变化更加大,这对算法模型和数据量都是极大的挑战。
  依托海量数据,项目组从数据中学习人脸自然的跨年龄变化规律,提出基于DDL(分布式蒸馏学习法则)学习策略的正则化迁移学习策略,形成具有上千层复杂结构的深度神经网络模型,跨年龄识别精度提升至近96%。
  对于未来人物视觉理解技术的发展方向,马利庄表示,面向复杂场景的人物视觉理解技术对于未来推动人工智能行业的发展、进一步加快智慧城市建设尤为重要,特别是服务机器人、融合人工智能的虚拟现实与增强现实技术将得到加速发展,成为万亿级新兴产业。