IT时报 -V1 时报要闻-
V1 时报要闻 下载阅读 下一版
1时报要闻
  • ·为何阿里系App“最懂我”
  • ·蓝牙耳机“辐射疑云”:无数值、无标准、无检测机构
  • ·本周新机

“隔屏有耳”系列报道之二

为何阿里系App“最懂我”

专家解读:“偷听”无须太高门槛 App结盟数据共享普遍存在

  

IT时报见习记者李丹琦IT时报记者孙妍
“外卖App到底有没有在偷听?”3月18日,《IT时报》微信公众号刊发了独家报道——《隔屏有耳,记者耗时3个月测试,美团饿了么是否在“偷听”?》后,便成为这周最热的话题,更多人提到,除了外卖App,电商类、资讯类、音乐类等App都曾出现疑似“偷听”现象,其中,生态圈模式最为完整的阿里系被吐槽最多。
  但也有网友提出质疑,认为在线“偷听”的数据量过大,App和手机都无法承受如此巨大的计算量,“巧合”很可能是基于现在互联网公司强大的大数据计算和推荐。
  来自云计算、语音识别、白帽子等多个渠道的专业人士向《IT时报》记者证实,通过授权的麦克风“监听”,并不需要太高的技术门槛,甚至在无网络的情况下都可以实现语音输入,也无需实时上传,只要触发某个关键词后,再提取文本并发送云端即可。澎湃新闻的一篇报道中甚至提到,有技术团队仅用了不到5个小时,便在技术层面实现了App锁屏时在后台仍可以“监听”用户讲话内容。
疑问一:“偷听”数据大,成本高,吃力不讨好?专家答:本地语音转换+关键词触发上传 大数据量不存在
  3月21日,澎湃新闻在《团队自编程序证实手机能偷听,安全专家:未发现“偷听”铁证》一文中展示了网络尖刀创始人曲子龙和他的人工智能团队进行的一场测试,仅用了不到5个小时,通过程序员编写示例代码,模拟打造一款手机软件,安装在一部安卓系统手机中,再设置为允许该模拟软件使用手机录音权限,然后将手机屏幕锁屏。
  结果,该款模拟手机软件成功获取了曲子龙团队的讲话内容,并传输给后台服务器转化成文字信息。
  简单来说,就是曲子龙团队从技术层面实现了App锁屏时在后台仍可以“监听”用户讲话内容。
  也有网友质疑,语音数据量巨大,能耗高,“偷听”用户的成本太大,这降低了App“偷听”用户的可能性。对此,曲子龙在视频中表示,可以把需要触发的词做个库留在App上,用户讲话内容一旦触发特定的词,便会唤醒这个应用开始监听及分析,以此降低能耗。
  国内知名白帽子公司KEEN GeekPwn实验室宋宇昊认为,App完全可以将麦克风听到的语音在上传之前先转换成文字,这已经是很成熟的技术。然后通过在文本里提取关键词发送云端,在云端分析文本特征,并和用户身份关联,给你精准画像,在大数据时代,这些技术都是相当成熟的。实际上,通过App语音输入的方式,在本地将语音转换成文字,上传的只是几个标签,完全不存在大数据量的问题。
  “将一个人一天讲的话处理成文本,也只有几页纸。如果采用关键词唤醒,数据量还会大大降低。将语音处理成文本的技术并不高级,现在很多输入法都能做到。”贵阳大数据交易所执行总裁王叁寿也持同样看法。
  不过,宋宇昊也强调,尽管技术上是可以做到的,但从目前观察来看,无法对App是否“偷听”做出结论。
  事实上,早在20世纪90年代,用于离线语音输入的PC客户端软件就已经出现。宋宇昊指出,随着近些年人工智能的发展,这一技术已经非常成熟,可以不依赖网络在手机中流畅地输入,甚至,一些语音输入的App可以在手机离线无网络的情况下实现语音输入。“1分钟的音频,只有100ms(毫秒)的延迟。”科大讯飞的技术专家说道。按现在的网速和机器性能,以上的操作可以认为是实时完成的。
  同时,随着边缘计算越来越成熟,“偷听”的成本还将大大降低。
  一位大数据技术专家向《IT时报》记者阐释,边缘计算可以解决传输成本、存储成本及云端搜索等问题,但技术难点在于离线计算的准确率。
  这并非凭空猜测。据上述专家介绍,在车险行业,车险服务商已经推出基于驾驶行为的保险,通过内置摄像头的行车记录仪和边缘计算和面部图像识别技术,系统能够捕捉驾驶员打哈欠、闭眼、打电话、抽烟等异常动作,这些数据都将用来做车险的风控模型,比如保险人的保费测算,而数据源是车内摄像头拍下的视频,通过边缘计算,可以大大降低数据上传量。
  近两年,AI手机概念渐成主流,随着手机的算力越来越强,计算都边缘化了,不需要云端计算的过多参与,那么,“偷听”这种技术成本越来越低,而且这个未来并不遥远,“在现在的终端成本上再增加1000元左右,就能支持边缘计算。”一位技术专家对《IT时报》记者展望。 下转02版
相关阅读《我喝不下杠精的“三表奶茶”,选择关掉手机麦克风》
  我们追问隐私是如何泄露出去的,三表说这是“搞笑”的事情,我们觉得这才是真正的搞笑。
  03版/时报快评