IT时报 -V6 新闻产业-
6新闻产业
  • ·因地制宜 尽快发展特色科学数据
  • ·云简科技发布可定制化智能业财SaaS运营平台

专访国家基础学科公共科学数据中心主任胡良霖

因地制宜 尽快发展特色科学数据

  

IT时报记者李丹琦
  科学数据是国家科技创新和经济社会发展的重要基础性战略资源。
  大数据时代,科技创新越来越依赖于对科学数据的分析挖掘和综合利用。不过,想要真正将科学数据转化为生产力,必须让数据资源共享应用、流动起来。
  早在2018年3月,国务院办公厅印发了《科学数据管理办法》,为我国科学数据管理确定了行动纲领,对地方科学数据管理提出了明确的要求。随着各省科技投入的不断加大,科学数据的管理也出现了可喜的势头,但仍存在完善的空间。
  近日,《IT时报》记者专访中科院计算机网络信息中心大数据部副主任、国家基础学科公共科学数据中心主任、CODATA中委会秘书长胡良霖,他呼吁,科学数据库建设刻不容缓,各省应当因地制宜发展特色数据资源,尽快建立省级科学数据中心,有序推动科学数据开放共享。各地方科学数据中心与国家科学数据中心在数据资源布局上优势互补,应用服务上纵横联动,形成国内科学数据管理应用的良好生态。
收集科学数据存在困难
  “科学数据”这四个字看似离大众的日常生活非常遥远,但如果将“数据”二字拿掉,只谈科学,便能清晰认知,科研活动产生的数据或者可以应用于科研活动的数据都可以被认为是科学数据。在胡良霖看来,不远的将来,科学数据会进入爆发阶段,在生产活动中发挥至关重要的作用。但就目前而言,科学数据的收集管理和应用服务依旧是管理者需要思考的问题。
  早在2018年,国务院办公厅印发《科学数据管理办法》,进一步加强和规范科学数据管理,保障科学数据安全,更好地为国家科技创新、经济社会发展和国家安全提供支撑。“《科学数据管理办法》发布以后,国内科学数据管理平台得到快速发展,并逐渐得到了国内外的认可,科学数据银行ScienceDB、世界山茶花品种数据库等已经汇聚国外数据,确实有很多欣喜的变化。但从各地方来看,特别是在当前复杂多变的国际形势下,科学数据库的发展刻不容缓,科学数据管理已经到了至关重要的阶段,目前仅在收集环节,依然存在很多问题。”胡良霖说。
  以基因测序数据为例,中国的科学数据由于成果发表等原因汇聚到国外,使得国外的国家级数据中心成为汇聚全球科学数据的资源高地。尽管国内有20个国家科学数据中心,Science DB等平台也已经在落实国内的数据管理,但科学数据收集依旧很慢,很多地方的科学数据工作还是空白。“总体而言,我们的出版科学数据建设仍需加强。一线科研工作者感受到的共享氛围还比较弱,大量珍贵的科学数据未被充分开发利用,造成很大的损失和浪费。”中国科学院计算及网络信息中心工程师姜璐璐说。
  中国极地研究中心国家极地科学数据中心副研究员吴立宗对此深有感触:“数据管理分为三个阶段,首先,收集数据;其次,管理数据;第三,用数据。其中,收集这块挺困难。”
  在刚刚闭幕的2021浦江创新论坛上,吴立宗对收集科学数据分享了自己的经历:“以极地数据中心为例,数据五花八门,但实际上数据量很小,拿来用也很麻烦,不同的数据库在打通和互换方面还存在规则不统一的问题。”
  胡良霖透露,针对上述痛点,他和吴立宗联合国内20个科学数据中心,对国内在用的数据标准进行梳理,形成一个中国科学数据标准白皮书,力争用共同的标准打通科学数据的共享工作。
可借鉴中科院科学数据实践
  “联合国教科文组织今年推行的开放科学推荐中提到,开放的数据需要具有好的可发现性、可获取性、可互操作性、可重用性。目前国际上对科学数据如何开放共享及遵循的原则采取的主流方式是‘FAIR原则’。在国家层面,国家从2002年开始酝酿到2011年全面启动,至今已有20家国家科学数据中心。”胡良霖说。
  在政策方面,从2018年国务院办公厅印发《科学数据管理办法》,到相继出台《关于构建更加完善的要素市场化配置体系机制的意见》《国家生物安全法》《数据安全法(征询意见稿)》等一系列文件,都对科学数据开放共享提出了指导建议,政策日趋完善。
  在实践方面,中国科学院有很长一段时间的积累,值得各地借鉴。1979年,中科院以红头文件的形式启动科学数据工作;1986年获国家计划委员会批准启动中国科学院科学数据库及其信息系统工程,一直持续建设至今,特别是“十一五”到“十四五”期间,科学院一直在布局信息化专项支持,从最早的科学数据库建设到科学数据网格、科学数据云、科学大数据以及科学数据中心体系的建设。“过去中科院围绕科学数据做了六方面的事情,第一,基础设施,基础设施现在已经成为中国科技云,下一步推动上升为全球开放科学云,从国内引领者走向国际倡导者、引领者;第二,技术层面有一个完善的技术体系和软件栈;第三,制定一系列标准;第四,构建完善的服务体系;第五,做好应用,没有好的应用难保可持续发展;第六,政策制度,上述六个方面通过实践形成生态闭环。”胡良霖说。
各地因地制宜建立数据库
  在浦江创新论坛上,《IT时报》记者获悉,上海市研发公共服务平台管理中心、上海科技创新资源数据中心联合发起的《上海科学数据共享倡议书》正式发布并签署。倡议书提出,力争逐步将上海打造成为科学数据汇集、共享和应用转化的高低,为城市数字化转型和全球科技创新中心建设助力。倡议书得到了上海众多高校、科研院所以及其他创新主体的积极响应,倡议单位之间就数据的创新应用和开放共享,展开多方面合作。
  上海是科学发展的排头兵,《上海科学数据共享倡议书》的发布也印证,地方对科学数据的重视程度越来越高。经过近年对多地科学数据工作的调研走访,胡良霖发现,自《科学数据管理办法》发布至今,尽管各省相继印发了省级的科学数据管理实施细则,但仍有很多内容需要补充。科学数据不仅仅是科技创新的体现,更是国家战略。科学数据的发展虽然无法立刻带来直观的经济效益,但对国家发展至关重要。他呼吁,各地政府应当在落实科学数据的收集和管理工作上展开新思路。“关于科学数据的收集,不需要盲目跟风,可以从当地特色入手,立足当地优势科研工作,建立特色的科学数据库,同时想办法把本地需要的外部科学数据引回本地,如镜像或者联合设立地方特色服务中心等。”胡良霖为各地科学数据的发展提供了一个新思路。
  一切能够应用于科学活动的数据都是科学数据,想要打造地方特色,需要从服务当地经济的产业或者地方特色入手。以上海为例,上海正在建设具有全球影响力的科创中心,其生产的科学数据,对科学数据的需求,应围绕科创中心重要工作布局科学数据工作,既提供科研原料,也让新科研活动产出的数据有序回归到数据池,服务后续科研工作。各地政府应考虑使用国家或当地提供科研经费的科研活动,展开对科学数据的收集和回流。