IT时报 -V9 新闻产业-
9新闻产业
  • ·被黑市“抢走市场”的大数据交易正规军
  • ·国内外监管趋严
  • ·益盟智投欲做个人投资市场的“新东方”

正规大数据交易额只占1% 过半大数据交易中心停摆

被黑市“抢走市场”的大数据交易正规军

贵阳大数据交易所作为全国唯一的国家级大数据交易所,发展情况也不如预期。

  

IT时报见习记者刘慧莹
“从贵阳大数据交易所成立的第一天起,我们就知道,至少要跟黑市斗争10年。”5月2日,贵阳大数据交易所执行总裁王叁寿如是对《IT时报》记者说。
每隔一段时间,总会有各种个人信息被买卖的新闻被曝出,最新的一条是美团外卖等外卖平台上的客户订餐信息,被店家、中介,甚至外卖“小哥”对外销售,内容具体到用户的姓名、联系方式和地址。
这样的数据对于大数据购买者来说,不仅价格实惠,而且“原汁原味”,而像贵阳大数据交易所这样的正规数据交易平台,却正经受劣币驱逐良币的阵痛。经过严格脱敏的大数据产品,并未如预期那样受欢迎,王叁寿甚至预估,数据交易所的成交额与黑市相比,只有1%。
2015年8月,国务院印发了《促进大数据发展行动纲要的通知》,大力推进大数据产业发展和应用,此后各地大数据交易中心、平台、网站风起云涌。如今,2年半的时间过去,记者对能够在网上检索到的23家大数据交易机构进行调查发现,至少有14家处于停运或半停运状态,它们的网站最新更新时间停留在2017年,有的网站甚至无法打开。
业内人士表示,一套完整数据流通管理制度的制定势在必行。

没能完成的盈利指标
  作为国内首家也是唯一一家国家级大数据交易所,从贵阳大数据交易所成立的第一天开始,王叁寿便知道,自己与黑市的斗争是场持久战,“我们不是摸着石头过河的事业,而是投石问路,因为前面没有石头。”
大数据背后的庞大价值从被人们认识到被充分挖掘,经历了一个相对短暂的过程。2012年,大数据逐渐走进国家发改委和科研机构的视野;2013年,科技部将大数据列入973基础研究计划,同时将其添加到国家自然基金指南的项目当中;2014年,大数据的产业链和价值链逐步形成,数据产业园区在政府的引导下展开竞争性建设。贵阳大数据交易所正是在这样的背景下,于2015年4月14日开始正式运营。“按照海量的数据市场需求,我们2016年就应该盈利了,但是直到2017年才有了微利。”王叁寿直言,在国内的数据交易市场,黑市与白市有着极大的差距:“我们交易一个亿,数据黑市就会交易99个亿。数据黑市就像是老鼠在偷米仓中的米,对正常的数据交易所是一种遏制。”
2017年3月,贵阳大数据交易所发布了2017年大数据10大工程中,拟定当年年度发展目标为交易规模累计3亿元人民币。然而,这个任务并没完成。时至2018年3月,贵阳大数据交易所的交易额仅突破1.2亿元人民币。

价格和应用的局限性
  数据交易所中交易的信息是严格脱敏(脱离敏感信息)后的大数据产品,成本高、信息少。以脱敏后的病例数据为例,这些数据来自正规渠道,在出售时需要去掉人名、身份证号码、电话号码、家庭地址、工作单位等敏感信息,每份价格在10元到20元之间。但这个价格与黑市中流通的数据价格相比,根本不占优势。在前文所述的美团外卖信息泄露事件中,外卖数据5000条起售,每万条价值800元,平均一条信息不到0.1元。
另一方面,脱敏数据的单一性,从某种程度上决定了数据买方在正规数据市场选择的局限。两年多前,上海电信大数据运营中心与复旦大学管理学院曾有过短暂的合作,具体合作方式为:大数据运营中心负责为数据打标签,并提供脱敏数据分析报告,复旦大学的学生则利用这些报告进行学术分析。但复旦大学管理学院教授徐云杰告诉记者,受限于数据量和数据来源,很多合作最后无奈中断了。上海电信相关人士也向记者表示,他们也希望有更多的数据方加入,并打通各方数据,但在现实中,各家电信运营商出于信息安全考虑,根本无法打通数据链。

暴殄的黑市与缺失的监管
  出于对低廉价格和丰富信息量的需求,数据黑市大获市场。但是这种置公众隐私安全于不顾的短期获利行为,无异于杀鸡取卵。更关键的是,有需求才有供给,正是因为一些数据购买公司对于敏感信息的索取,才让个人信息被大量盗窃并泄露。
王叁寿仍以病例数据为例,脱敏的病例数据对科研机构具有极高的科研价值,可以帮助降低国内医院误诊误判的比例,但对于保险公司来说,脱敏数据没办法帮助它判断具体投保人的情况,因此需要完整信息。此外,还有大量黑市数据销往互联网金融、P2P网贷等没有央行征信系统的公司被用于征信。
王叁寿认为,在巨大的利益诱惑面前,黑市近乎无法抵制,市场这只看不见的手近乎失效,唯有靠国家强制力手段进行管控。“很多买家都是揣着明白装糊涂。在数据黑市上,无论买方还是卖方,其实都在犯法。一旦某些关键数据通过黑市流通到国外,会为国家某些系统带来毁灭性的打击。”王叁寿呼吁国家应对大数据市场进行监控。
贵阳大数据交易所董事,井通科技CEO武源文近两年来着重关注区块链,他认为大数据市场的整治根本上还是要靠技术,如果能用区块链技术让大家更方便地知道谁在使用数据,让数据商知道数据在被谁使用,也更便于对市场上的数据进行定价,而权限的参透式管理也可以保障隐私数据通过个人授权才能被使用。但这项技术的具体推进还需足够的时间与数据交易机构的全力配合。“所谓的技术手段其实就是给数据加上GPS。”王叁寿认为数据的确需要溯源,贵阳大数据交易所也在这方面进行尝试,但他认为,摆在眼前更重要的问题是,我们缺乏一套完整的数据流通管理制度,“从数据采集、清洗、脱敏、脱密、建模、分析算法到应用,我们的整个大数据的链条非常完整,技术水平也很高,但数据交易的行业规则、交易标的的合法性、资产评估与定价等问题始终没能确立。”