张新红:数据化城市的未来

来源:信息化研究部   作者:张新红   时间:2016-06-03

——在2016贵阳数博会“智能城市大数据与基础设施建设论坛”上的主题发言
2016年5月25日
国家信息中心信息化研究部主任 张新红

  大家下午好。
  因为我是做信息化政策研究的,所以更关注一些城市未来发展的理念变化。关于未来城市到底会是什么样子,现在已经有一些说法,比如数字城市、智慧城市、智能城市、信息化城市等。我个人觉得,无论是哪一种表述,数据化都将是未来城市发展的前提和基础。由于时间的限制,今天就讲三个关键词,连带着阐述三个基本观点。第一个关键词是“数据化”,所有能数据化的都将数据化;第二个关键词是“数据化城市”,在我看来,数据化城市是城市升维的重要标志;第三个关键词是“数据开放”,建设数据化城市的突破口就在于数据开放。
  一、所有能数据化的都将数据化
  第一个基本观点:所有能数据化的都将数据化。这里也会涉及到几个词汇:数据、大数据、数据化。
  首先,数据是人类社会的原始宝藏。
  人类认识世界和改造社会靠的是什么?靠的是智慧。所以我们现在就提出了要建设智慧城市的目标。那么问题就来了:人类的智慧 从哪里来?现在大家已经慢慢明白了一个道理——最底层的知识就是数据。数据就相当于人类智慧的原始材料。用公式表示就是:数据=原始材料。
  数据向上一层就是信息。将基础数据进行加工处理就会得到信息。也就是说,信息就是根据需要加工处理后有一定含义的数据。用公式表示就是:信息=数据+处理。
  信息再往上走就可以转化为知识。知识就是人类对世界正确的认知。通过对信息的归纳与演绎,我们就可以得到一些正确的理论,也就是知识。用公式表示就是:知识=信息+归纳与演绎。
  利用已有的知识去改造客观世界,就要靠智慧了。所以我们说,智慧是综合利用各种知识改造世界的能力。用公式表示就是:智慧=知识+综合利用。
  从上述几个基本公式可以看出,如果没有数据,信息、知识、智慧就无从谈起。
  数据化的定义有狭义和广义之分。从狭义看,数据化是指将事物及其运动转化为可识别信息的过程。数据就是一种客观存在,但找不出来、捕捉不到这些数据,就没法识别它。把这些客观存在的数据找出来,就是数据化的过程。从广义看,数据化是指利用基础数据全面认知并优化改造客观世界的过程。在这个意义上说,数据化城市发展就是努力将城市数据化的过程。
  其次,大数据是获取数据的重要手段,也是数据化的集中体现。
  大数据不同于小数据。相对于大数据而言,过去我们熟悉的标准化统计数据就是小数据。大数据所以有这么快的发展速度,是因为背后有一些列的推动力量,包括摩尔定律的作用、互联网与移动互联网的发展,以及社交网络、传感设备、智能终端、智能制造的出现等,正是这些力量促使了大数据发疯似的增长。
  从种类上看,大数据包括传统的统计数据,但更过的还是实时、连续发生的交易数据、行为数据、传感数据等,其基本特点就是多杂碎快。
  大数据之所以重要,是因为它能做一些过去的小数据做不了的事情。大数据的作用可以简单归纳为五个效应:一是识别效应,它可以身份、位置、状态、真假;二是重现效应,它可以再现过去的场景,实现过程的追溯;三是关联效应,通过对数据的相关分析、联想分析、聚类分析,可以找出事物之间的联系;四是溢价效应,大数据的应用可以产生新的数据,有利于发现事物变化的内在规律;五是预测效应,利用大数据可以对经济、天气、灾害、疾病以及人类的行为进行预测分析。 
  第三,数据化是信息社会的重要标志。
  人类经过农业社会、工业社会,现在已经进入了信息社会。信息社会一定是高度信息化的社会,也一定是高度数据化的社会。
  信息的作用在于减少不确定性、减少不对称性、减少不可知性,数据就是提供了这种可能。尤其是大数据技术的出现,使过去不可计量、存储、分析和共享的很多东西都被数据化了,这标志人类在寻求量化世界的道路上前进了一大步,人们认识世界的能力有了空前提高。
  这里推荐大家认识一位美国的物理学家——约翰?惠勒。他是黑洞的命名者,曾经留下过一句名言叫“黑洞无毛”。今天提请大家记住他的另外一句名言:“万物源于比特!”(IT FROM BIT!)相信若干能认真领会这句话的哲学意义,对于把握数据和大数据的本质、功能、作用会很有帮助。我们可以借用一下网络语言的表达方式:不管你意识到还是没意识到,数据就在那里,不多也不少。比如,我们现在已经熟知的定式、公理、公式,客观上早就存在,一旦有人发现了,就变得非常有价值,就可以成为我们行动的利器。数据就在那里,但过去我们没有技术和手段,不能发现和捕捉到它。现在我们有了大数据技术,就离发现事物的本质及其变化规律更近了。所以我们说,有了大数据,人类认识和改变世界的能力就大大提升了。
  二、数据化城市是城市升维的标志
  第二个观点:数据化城市是城市升维的标志。
  这里借用《三体》里的一个概念:升维。人类从农业社会、工业社会到信息社会,就是一个不断升维的过程。对于农业社会而言,工业社会就是升维。对于工业社会来讲,信息社会就是升维。信息社会与工业社会之间的竞争,不是在一个维度,更不在一个层次。
  信息革命已经将人类带进了信息社会。所谓信息社会,就是建立在工业社会之上,全面实现信息化,并体现出以人为本、可持续和包容发展理念的新型社会。
  当工业社会升维到信息社会时,城市也将从工业化城市升维到信息化城市,而数据化城市就信息化城市的重要标志。
  数据化城市就是高度数据化的城市,其基础设施、经济、社会、政务、生活等都将实现高度的数据化。概括地讲,就是一切都将数据化,做到“用数据说话,靠数据决策,依数据行动”。
  信息革命是推动数据化城市到来的主要动力。十多年前就有人说摩尔定律即将失效,现在看来完全不是那么回事,大家任然相信信息革命正在孕育新的重大突破。凯文?凯利常说的一句话就是:真正的变化还没有到来,真正伟大的产品还没有出现,今天才是第一天。他在去年的新书《必然》中提出了未来科技发展的十二个大趋势,也可以看作是推动科技发展的十二大动能,即:形成(Becoming)、知化(Cognifying)、流动(Flowing)、屏读(Screening)、使用(Accessing)、共享(Sharing)、过滤(Filtering)、重混(Remixing)、互动(Interacting)、追踪(Tracking)、提问(Questioning)、开始(Beginning)。
  我个人觉得数据化的推动力可能会来自以下几个方面:(1)信息化:全球经济发展的推动力;(2)网络化:连接一切;(3)宽带化:1G宽带不是梦;(4)智能化:智能产品、智能工厂的出现;(5)服务化:服务环节创造的价值可以占到90%以上;(6)社会化:管理运营的社会化;(7)生态化:从价值链向生态圈转型;(8)平台化:企业运营、政府治理都将是平台化的。
  数据能力将成为决定城市竞争力的核心要素,包括:数据采集能力、数据处理能力、数据传播能力、数据利用能力、数据安全能力等。未来城市之间的竞争将体现为数据能力之间的竞争。一个高度数据化的城市在与工业化的城市竞争时,就可以实施降维打击,使其最擅长、最具威力的功能和手段根本发挥不了作用。比如,微信对于短信、互联网金融对于传统银行、网约车对于传统出租车等都可以看作是降维打击。
  三、数据开放是建设数据化城市的突破口
  第三个观点:数据开放是建设数据化城市的突破口。
  如果对如何建设数据化城市不知道从何下手,至少有一件事情是可以做的,那就是数据开放。把数据开放出来,就算是找到了数据化城市建设最重要的突破口。
  我非常欣赏《大数据时代》作者舍恩伯格的观点:“政府不需要去补贴和建立所谓新兴产业,只需要开放政府的数据,就能培育一个新的增长点——新型的服务业。建立一个大数据的基础设施,不是政府该干的活儿,而开放政府数据库并不是说要为了民主化,而是为了让经济增长潜力发挥出来,因为公司可以用这些数据创造价值,可能创造新的服务行业。数据已经在那儿了,开放给公众没有什么成本。”
  数据开放与信息公开有所不同。以前我们常说的信息公开往往是政府将加工好的信息放到网上去,而数据开放更多强调的是开放基础数据,比如交通大数据、通信大数据等。让这些数据流动起来,才能够真正释放其应有的价值,才能够通过这些数据去整合资源,创造出新的商业模式和新的业态。
  通过数据开放产生经济和社会价值的实践已经有很多,这里举几个例子。
  第一个例子是阿里巴巴的“天池大数据竞赛”。举这个例子也是因为它与我们现在所处的贵阳市有关系。2014年的首次“天池大数据竞赛”使用的就是贵阳市政府提供的出租车等红绿灯的数据,希望藉此找到减轻道路拥堵的更好方法。这次活动共吸引了7276支队伍参赛,其中海外参赛队伍有148支。2015年天池大数据竞赛共吸引到全球超过40个国家和地区的22858支队伍。2016年天池大赛推出数字娱乐、互联网物流、O2O等热门领域算法竞赛,并将拓宽领域边界,涵盖数据可视化和程序设计大赛,估计又将有新的惊喜出现。
  第二个例子是上海交大的“智慧校园开放数据大赛”。这是去年参加上海论坛是听到的一个很有意思的案例。上海交大开放了3万名学生的校园一卡通消费数据和WiFi网络站点流量数据,共计有1400万条数据,希望能找到智慧校园的好方案。大赛吸引了151个团队参赛,最后有10个团队进入决赛。据说各个团队表现出来的智慧大大超出了评委们的想象,而且在校学生的创新力一点也不亚于业界顶尖团队。我记得其中一个团队根据这些数据竟然测算出了一个“学霸指数”和“学渣指数”来,是不是很有意思?当然还有团队设计出了校园人流可视化APP、通过招聘网站浏览数据测算出毕业生就业压力等。
  第三个例子是上海市政府组织的“‘游族杯’开放数据创新应用大赛”。这次活动于2015年8月启动,以城市交通为主题,运用交通管理部门和相关企业提供的海量开放数据,以产品原型为比赛对象,面向全国征集改善城市交通、便利市民出行、创新商业模式的程序应用和解决方案。开放数据集包括交通卡、交通事故、出租车轨迹、公交车运行、地铁运行、空气质量、气象检测、新浪微博等上千GB。吸引了2914人报名参赛,完成组队817个,95%的参赛者来自中国大陆地区,另有5%的选手来自港、澳、台地区以及其他国家。这次大赛征集到有效创意方案505个,最后是上海交通大学摘了桂冠。
  近年来有不少城市和企业开展了类似的数据开放应用大赛活动,让人们认识到了数据的价值和数据开放的重要性。
  最后作一个小结:所有能数据化的都将数据化,数据化城市是城市升维的标志,数据能力是信息时代城市竞争力的核心要素,数据开放是建设数据化城市的突破口。信息社会已经来临,要么适应要么被适应,现在的行动决定未来。
  谢谢大家。



主办单位:国家信息中心 京ICP备05063309号 技术支持:中国经济信息网

地址:北京市西城区三里河路58号 邮政编码:100045 电话:010-68557000 传真:010-68533919