单志广:解读《关于促进大数据发展行动纲要》(上)

来源:信息化研究部   作者:单志广   时间:2015-09-22

    2015年8月19日,国务院总理李克强主持召开国务院常务会议,通过《关于促进大数据发展的行动纲要》(以下简称《行动纲要》)。9月5日,《国务院关于印发促进大数据发展行动纲要的通知》(国发〔2015〕50 号)正式发布,在全社会引起广泛影响。《行动纲要》由国家发展改革委牵头,会同工业和信息化部,自2014年初开展前期研究,历经深入的专题研究,并广泛征求了相关部门、专家学者的意见和建议,历时一年多时间编制完成。《行动纲要》是到目前为止我国促进大数据发展的第一份权威性、系统性文件,从国家大数据发展战略全局的高度,提出了我国大数据发展的顶层设计,是指导我国未来大数据发展的纲领性文件。
    下面从本人作为研究起草工作小组主要成员的角度,就《行动纲要》的个人基本认识和理解作一下解读。 
    一、从国家信息化发展的战略全局把握大数据的概念与范畴 
    新一轮信息技术革命与人类经济社会活动的交汇融合,引发了数据爆炸式增长,大数据的概念应运而生。然而到目前为止,全社会对“大数据”的认识并没有达成一致公认的程度。例如,维基百科提出“大数据”是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。这种定义对于实际应用而言几乎没有意义,除了少数的互联网巨头和IT巨无霸企业谁也没有这种规模的数据。企业界通常是将自己可利用到的海量数据视为大数据。政府部门认为自身数据很多,将部门数据都整合起来会有几十倍的增长,堪称大数据了,所以他们心目中的“大数据”就是整合后的政府数据资源。一种在学术界广为人知的“4V”表述是:“大数据”是以体量巨大(Volume)、类型繁多(Variety)、存取速度快(Velocity)、价值密度低(Value)为基本特征的数据集。在这种界定下,大数据应用的本质是类似沙里淘金、大海捞鱼、废品利用的过程,大数据并不直接意味大价值,实际上是指经过分析发掘后可以释放潜在的价值。在这种“4V”界定下,传统意义上政府掌握的数据资源看起来不应归为“大数据”,因为它不符合“价值密度低”的界定,而且在数据类型上仍然以结构化数据为主,并且往往是常规数据处理技术就能够胜任的。
    人们对大数据概念理解的不一致和认识上的分歧实际上反映了现有的大数据概念与现实需求的脱节,特别是与政府需求的脱节。笔者认为,从推进国家信息化发展的角度看,对大数据进行严格定义或许并不重要,能够利用大数据提升全民数据意识、发展数据文化、释放数据红利、打造数据优势才是硬道理。大数据热强化了社会的数据意识,这对于中国才是至关重要的。长期以来中国社会文化一直缺乏精确的数据意识,中国人的传统习惯是定性思维而不是定量思维,正如胡适先生所说的是“差不多”文化,这种文化阻碍了科技在中国的发展,没有精确就没有现代科技。数据文化的本质就是尊重客观世界的实事求是精神,数据就是定量化的、表征精确的事实,重视数据就是强调用事实说话,按理性思维的科学精神,因此提升全社会的数据意识和数据精神是大数据热的巨大贡献。
    科学认识大数据的概念和范畴,对于准确理解和深刻把握《行动纲要》的主要内容和精神实质是非常重要的。我认为,应该从国家信息化发展的战略全局把握大数据的概念、本质与边界范畴。信息化的核心是数据,只有政府和公众都关注数据时,才能真正理解信息化的实质。数据是与物质、能源同等重要的基础性战略资源,数据的采集和分析涉及每一个行业,是带有全局性和战略性的工作。因此,从国家信息化发展的全局来看,我认为可以把“大数据”广义地界定为:我国现代信息化进程中产生的和可被利用的海量数据集合,是当代信息社会的数据资源总和,是信息时代的全数据,既包括互联网数据,也包括政府数据和行业数据。实际上,在《行动纲要》中,大数据就是采用了这种广义的界定方法。因此,大数据既是一类呈现数据容量大、增长速度快、数据类别多、价值密度低等特征的数据集;也是一项能够对数量巨大、来源分散、格式多样的数据进行采集、存储和关联性分析的新一代信息系统架构和技术;更代表了一种新的思维方式——大数据思维,是能够帮助人们从信息社会海量数据中发现新知识、创造新价值、提升新能力、形成新业态的强大的认知世界和改造世界的能力。
    二、大数据是我国信息化发展步入深水区后的核心主题和战略抉择
    近年来,我国经济社会信息化建设快速推进,信息化水平不断提高。但随着经济社会发展进程的不断深化,我国日益面临诸如食品药品安全、公共安全与应急管理、社会信用体系、生态环境保护、民生公共服务等复杂、多维、并发的经济社会难题。过去以“金字”工程为代表的纵向烟囱式信息系统和以地方、部门信息化为代表的横向孤岛式信息系统,已经无法有效支撑经济社会发展难题的解决,“只管自家门前雪”的信息化管理模式已经严重不适应现代社会的治理需求,往往“按下葫芦浮起瓢”,信息化对经济社会发展的支撑和引领作为无法充分发挥,迫切需要打破部门割据和行业壁垒,促进互联互通、数据开放、信息共享和业务协同,切实以数据流引领技术流、物质流、资金流、人才流,强化统筹衔接和条块结合,实现跨部门、跨区域、跨层级、跨系统的数据交换与共享,构建全流程、全覆盖、全模式、全响应的信息化管理与服务体系。
    我国信息化发展已步入深水区。可以说,容易的、皆大欢喜的条块和局部的信息化系统已经完成了,正如习近平总书记所说“好吃的肉都吃掉了,剩下的都是难啃的硬骨头”。《行动纲要》的根本出发点和核心主题就是推动解决信息化进入深水区后的硬骨头、老大难问题,主要包括:第一,为解决经济社会难题亟需交换、融合、共享的各类数据和信息,在社会中依据类别、行业、部门、地域被孤立和隔离;第二,同一时空对象所属的各类数据和信息之间天然的关联性和耦合性被割裂和遗忘;第三,政府数据开放和政务信息共享程度受限,信息资源开发利用水平不高,其根源既有大数据处理方面的技术障碍,也有公共权力部门化、部门权力利益化,部门利益合法化带来的体制弊端;第四,数据和信息服务的便捷化、高效化、产业化、智能化水平不高。《行动纲要》的发布,彰显了我国信息化发展的核心已从前期分散化的网络和应用系统建设,回归和聚焦到充分发挥数据资源的核心价值,从而提升国家信息化发展的质量和水平。因此,大数据已成为国家信息化深化发展的核心主题,发展大数据已成为构建数据强国、推动大数据治国的必然选择。 


主办单位:国家信息中心 京ICP备05063309号 技术支持:中国经济信息网

地址:北京市西城区三里河路58号 邮政编码:100045 电话:010-68557000 传真:010-68533919