我国公共数据开放面临的问题及对策研究
  作者:公共技术服务部   时间:2021-11-22

自2009年世界上第一个数据开放网站上线以来,公共数据开放已成为各国发展大数据的重要战略举措之一。近年来,我国公共数据开放取得了明显进展,但是仍然存在数据质量不高、实用价值不强、应用成效不突出等问题。为此,有必要参考借鉴发达国家数据开放的经验做法,促进我国公共数据开放工作提质增效、服务数字经济发展。

一、我国公共数据开放工作面临的主要问题

目前,我国公共数据开放取得长足发展,北京、上海等一批省级公共数据开放网站陆续建成,但促进数字经济、激发社会创新的作用还不突出。

(一)数据实用性不高

各级政务部门开放的公共数据普遍存在数据质量不高、数据价值低、机读性差等现象,在促进社会公众办事创业中的实用性还不高。一是存在“形式开放”倾向。现有开放数据从量上看形成了较大规模,但涉及核心业务办理、社会公众迫切需求的数据较少,实用性较强的公共数据开放程度不足,无法满足社会公众的迫切需求;部分开放平台存在“有目录无数据”“有数据无价值”的情况,开放工作流于形式。二是数据更新不及时。我国各级地方政务数据开放网站开放的数据普遍周期较长,据公开资料统计,地方平台约有46%的平台没有更新数据,只有8.5%的地方平台连续两年发布了新的数据集。三是监督约束机制弱。各地都在探索建立数据开放的监督约束机制,但是在实际工作中,各部门在是否开放数据、开放什么数据的自由裁量权还较大,现有监督约束机制难以有效落地。四是开放评价不到位。我国还未形成较为权威规范的公共数据开放评价机制,现有第三方评价工作缺乏权威数据支持、影响力还不足,不能全面反映用户的真实体验,难以发挥“以评促改”的作用。

(二)平台功能不完善

目前,国家公共数据开放网站尚处于建设阶段,建立数据开放网站的中央政务部门还很少,部分地方建立了省级、地市级数据开放平台,但是平台建设总体良莠不齐,未能形成标准统一、互联互通的公共数据开放平台体系。同时,仅有2.4%的地方平台提供了数据请求功能且公开了用户的数据请求,仍有37.8%的地方平台未提供此功能,互动平台功能多数未能显现。此外,各地数据开放平台并未实现数据库的有效连通,各数据库之间的技术标准不同、基础设施重复建设等问题更是加大了公共数据汇聚设的成本,增加了用户获取数据的难度,影响了用户体验。

(三)长效机制待加强

一是工作合规性仍需强化。近期正式颁布实施的《数据安全法》《个人信息保护法》等法律法规对公共数据开发利用提出了新的要求,各级政务部门数据开放工作还不完全满足数据安全法的要求。此外我国仍无专门的数据分级分类指南、数据安全保护细则、元数据治理规范等管理规范条例。二是标准化水平仍需提升。2020年,国家标准委颁布的《政务数据开放共享第1部分:总则》《政务数据开放共享第2部分:基本要求》《政务数据开放共享第3部分:开放程度评价》等相关标准,从数据资源、平台设施、应用成效、管理制度和安全保障等几个方面对公共数据开放进行了规范,但是由于实践在标准颁布之前,各地在推进公共数据开放中尚未遵循相关标准要求优化工作,标准落地见效有待加快。三是数据开放授权机制仍未建立。我国尚未制定政务数据开放授权许可协议,无法有效规避和控制涉及个人隐私、数据安全的潜在风险,数据开放中的很多具体操作性问题无章可循,数据开放的规范化程度和可控性水平都有待提高。

二、主要发达国家数据开放特点

发达国家是世界上数据开放工作启动较早、开放成效较好的国家,经过十几年的实践,逐步形成了较为成熟的数据开放体系,可总结为以下三个方面特点:

(一)建立了多源统一的数据资源体系

发达国家在推进数据开放工作时注重以社会公众的实际需求为依据,确定数据开放的范围和内容,逐步形成了多源统一的数据资源体系。在数据源方面,发达国家主要开放了包括天气、农业、消费、生态环境等在内的数据集,与社会公众的需求契合度较高。在开放原则方面,为了满足社会公众、科研机构、企业组织等部门的数据需求,发达国家国坚持“除例外均开放”的原则,除非有相关法律规定无法开放的数据,其他数据原则上均需开放。在数据查询方面,发达国家数据开放网站通常设计了单项数据查询、主题数据查询、程序接口查询等多种查询方式,可满足不同的需求场景。在数据格式方面,开放的数据集包括PDF、XLS、XML、HTML、RDF等多种可机读性的数据格式,并突出强调对原始数据集的开放。

(二)建立了多管齐下的安全保障体系

发达国家信息安全立法工作起步较早,相关法律法规、技术标准、数据许可协议机制等较为健全,有效化解了数据开放可能引发的个人隐私、商业秘密、国家安全等潜在风险挑战。在法律法规上,美国形成了以《信息自由法》《隐私权法》 《开放政府指令》等代表的一系列规范数据开放的法律条文。在标准规范上,从数据源头出发,制定了元数据治理标准等一系列数据开放的技术标准,有效规范了数据开放行为。在许可协议上,发达国家均建立了较为细致的开放许可协议机制来规范开放工作。美国利用“知识共享组织”(Creative  Commons)发布的CC系列授权协议规范了数据开放许可;英国政府制订了英国政府许可协议(UKGLF,The UK Government Licensing Framework),提升了数据开放工作的精准化、可控化水平。

(三)建立了多方参与的评价激励机制

主要发达国家大多构建了多方参与、客观公正的公共数据开放评价激励机制,不断优化完善数据开放工作。在评价体系方面,美国政府制定了元数据质量评估体系,开发了“仪表板”系统(PODD,Project Open Data Dashboard),评估和监测各联邦机构数据开放工作执行情况。在国际接轨方面,定期以数据需求方和使用方为调查对象,参考国际开放知识基金会(OKF)的全球开放数据指数(GODI)等指数对本国数据开放成效进行评价。在社会参与方面,美英等国定期举办数据圆桌会议,邀请数据应用企业和机构,围绕如何更好开放和利用数据展开交流;政府部门也会定期收集社会公众和组织机构的使用反馈,完善数据开放平台的功能和数据资源。

三、优化完善我国公共数据开放工作的政策建议

(一)完善数据开放机制

建议制定并发布统一、权威的公共数据开放目录,探索建立数据开放许可协议机制,明确数据开放各方权责,规范数据开发利用。其次,应尽快出台数据分级分类的政策法规,明确可开放数据的范围,推进数据脱敏技术应用,完善各敏感程度数据的开放管理规定,化解制约公共数据开放所面临的个人隐私、商业秘密、国家安全等潜在风险。最后,我国应充分借鉴开放知识基金会等机构的数据开放指标,探索建立基于公众需求的开放数据质量评估模型,加强社会监督,结合现有第三方数据质量评估模型,全面系统的评估开放数据的质量,强化评估工作的指挥棒作用。

(二)推进需求导向型开放

在数据开放供给上,优先围绕数字经济发展、产业创新等现实需求,推进各部门高质量公共数据的开放,在保证数据的可机读性基础上,向社会公众开放内容更为多样、应用价值更高的数据。在社会需求反馈上,相关部门需要进一步突出数据开放的需求导向和结果导向,定期收集社会公众的使用反馈情况,根据反馈结果明确数据开放的重点领域,提高数据开放的针对性。在数据内容更新上,相关部门应在立足客观实践和公众需求的基础上,对开放数据进行分类管理,制定合理的更新周期,针对公众需求较大的数据适当缩短数据更新周期,并定期根据公众数据需求的变化改变数据更新周期。

(三)优化数据开放平台

在平台互联方面,应加快推进各层级公共数据开放平台的互联互通,制定统一的公共数据开放平台管理制度和标准规范,构建全国统一的公共数据开放平台体系,逐步形成一站式、便捷化、全口径的公共数据开放服务能力。在平台功能方面,应从社会公众的角度出发,不断强大搜索功能,加强完善二级搜索,增强对数据的分级分类管理、关联数据管理,便捷社会公众;加强互动和交流板块的设计,及时展示意见交流和互动情况。在数据保护方面,应建立健全公共数据开放平台的安全管理机制,加强密码技术、身份鉴别技术、数据沙箱技术等关键技术的研究和应用,防范和化解公共数据汇聚、开放可能引发的各类数据安全风险挑战。

(作者:王晓冬,国家信息中心公共技术服务部;刊发于《中国经贸导刊(中)》2021年第10期,内容有更新调整)