IT时报 -V10 新闻产业-
10新闻产业
  • ·新范式探索数据流通“可信”“可控”
  • ·中国的Wi-FI 7

数据开放面临“不愿、不敢、不会” 《数据跨域管控白皮书》解题

新范式探索数据流通“可信”“可控”

填补标准空白可信基础设施规模建设降低成本

  

IT时报记者孙妍
  数据,已然成为继土地、劳动力、资本、技术之后的第五大生产要素。在数字中国的进程中,数据是基石,只有流通才有价值。当大模型即将走向国力之争时,数据成为推动大模型能力演进的核心能源。
  不久前,《数据跨域管控白皮书》(以下简称《白皮书》)在第六届中国数据法律高峰论坛上发布。该《白皮书》由华东政法大学数据法律研究中心、蚂蚁集团牵头,华控清交、华为云、中电数创、广州数据交易所等单位联合参与。
  《白皮书》首次系统化给出数据跨域管控实操指引,填补了行业空白,也是行业共同应对数据滥用、数据泄露、责任不清等数据流通风险挑战的重要成果。
首提可信数据流通参考架构同题共答“不愿、不敢、不会”
  我国是首个将数据列为生产要素的国家,并鼓励公共数据对社会开放和共享。12月8日,国家数据局局长刘烈宏在第二届数字政府建设峰会暨数字湾区发展论坛上表示,要加快推进数据要素市场化配置改革,全面提高数据资源开发利用水平,让公共数据“供得出、流得动、用得好”。
  据有关机构统计,目前全国省、地两级已上线226个数据开放平台,开放数据集数量从2017年的8000多个增加到2023年的34万多个,17个省(市)、10个副省级城市开展了公共数据授权运营实践,在普惠金融、交通出行等领域形成一批应用场景。但是,刘烈宏也指出,目前数据共享开放阻力大、顾虑多,存在“不愿开放、不敢开放、不会开放”的难题。
  同题共答,《白皮书》给出了一种新思路。
  数据作为生产要素提出后,产权成为行业争论焦点。在“数据二十条”搁置数据权属之争后,行业面临着数据流通使用时如何确保安全可控的挑战,《白皮书》围绕这一命题提出了“数据跨域管控”思路。
  跨域管控是指数据离开持有者的域后,数据持有者仍然能够有效地控制数据的流转过程,避免其被窃取或者非预期地使用。
  在实操过程中,靠技术或法律某个单一层面无法较好地管控,所以《白皮书》从管理、技术、法律层面形成了三位一体的数据跨域管控解决方案,包括事前的数据脱敏、加密等数据治理机制,事中针对场景和安全等级界定使用范围等跨域过程管控机制和事后的可信审计监督机制。
  同时,《白皮书》提出了“数据来源可确认、数据可用不可见、数据可算不可识、数据使用可界定、数据流通可追溯”五大要求,还提出了明确数据流通中各主体责任的可行方案,助力构建中国的可信数据流通参考架构。
建立治理新范式数据要素流通助力AI研发
  在大模型时代,绝大多数AI从业者认为,虽然眼下仍为“算力风暴”所困,但未来大模型的竞争主要是优质数据之争。目前,全球70%的数据源仅停留在免费公开数据集的层面,大模型成长所需的高质量数据库仍存在供给不足、质量不高、多样性匮乏、标准欠缺等问题。
  数据要素市场有助于促进AI研发和应用,促进知识生产,但需要用技术驱动数据转化为生产力。华东政法大学教授、《数据跨域管控白皮书》联合项目组负责人高富平在会上指出,“数据不同于传统的生产要素,是一种难以排他控制的风险性资源。我们希望通过搭建跨域管控体系,实现数据流通风险可预防、合规责任可证明,数据责任可追溯,从而进一步推动数据要素市场的发展。”
  在他看来,数据交易是在特定目的、特定使用下的交易,所以管控是数据流通中的基石。
  “传统产权交易是我把水给你后,水就是你的了。但是数据不行,数据给你之后,你只能喝三分之一,或者你只能将水用于灌溉,只能灌溉某片田。比如数据给你用于反诈,你就不能用于营销。”高富平向《IT时报》记者解释,“可信数据流通要解决什么?一方面给参与其中的好人建立相同的规则流通数据,从而解决产权的问题,另一方面是要抓坏人,将不遵守规则、滥用数据的人抓出来承担相应责任,解决可控、可审计、可追溯的问题。”
  在传统产权问题无解之时,需要引入市场,建立一套治理新范式。
  蚂蚁集团则为《白皮书》输出了行业经验,并在实践中推动行业共建。蚂蚁集团副总裁、首席技术安全官韦韬阐述了数据安全流通的本质,是要构建技术信任机制,保障数据在不同主体间流通时,用技术来确保“身份可确认、利益能对齐、能力有预期、行为有后果”这四大信任基石。
  “《数据跨域管控白皮书》的发布是一个重要里程碑,只有把使用权跨域管控在数据流通场景里作为核心技术要求明确出来,才能找到各种安全技术支撑保障的锚点。”韦韬提到,数据要素流通是一个域外循环问题,责任主体不清,利益诉求不一致,能力参差不齐,责任链路难追溯等风险,导致传统数据安全的信任基石遭到破坏,因此数据要素流通需要全新的技术要求标准与技术方法体系。
  据了解,欧美还没有将跨域管控作为核心命题提出来,在国内,该《白皮书》提出的数据跨域管控实操指引,用法律和技术等多个层面系统性地解决这一难题,也将填补行业标准的空白。
  成本也是横在数据流通面前的一道坎,是大家不愿开放的内在原因。韦韬对《IT时报》记者表示:“提到隐私计算,大家第一印象是太贵了,相当于要付出明文分布式计算千倍万倍的成本。未来,密态天空计算(允许基于数据密态的应用能跨多个云厂商运行)将能有效降低成本,但只有当支持可信数据流通的基础设施上规模,成本才能降下来。对于一般数据而言,将来隐私计算只要付出两倍于明文分布式计算的成本;对于重要数据而言,付出不超过十倍的成本。”
  据韦韬透露,很多国内云厂商等都已在考虑,如何在建设云的同时构建可信基础设施,从芯片到云,再到云互联的天空计算,共同往这个方面演进。
  据《IT时报》记者了解,项目组后续将进一步探索可信数据要素流通参考架构,帮助完善数据可信流通制度,助力数据价值大爆发。