于施洋 王建冬 童楠楠:基于大数据的智慧政府门户建设:中国智慧城市建设的重要方向

来源:信息化研究部   作者:于施洋 王建冬 童楠楠   时间:2014-08-06

【摘  要】本文在回顾国外智慧政府门户网站研究和实践的基础上,基于中国政务网站智能分析云中心提供的82家中国政府网站用户访问行为大数据集,对政府网站用户需求的时空变化规律、主题分类等进行了分析,并从网站页面优化、服务流程优化和栏目体系优化三个层面分别介绍了基于热力图、漏斗图、需求相似度分析等数据挖掘技术开展政府网站服务优化的方法和案例。

【关键词】大数据 智慧城市 智慧政府门户 用户行为分析

 

1.前言

当前,“智慧城市”已成为信息化时代城市治理和社会发展的新模式、新形态。智慧城市的理念是充分运用信息和通信技术手段感测、分析、整合城市运行核心系统的各项关键信息,对包括民生、环保、公共安全、城市服务、工商业活动在内的各种需求做出智能的响应,为人类创造更美好的城市生活。智慧的城市离不开智慧的政府,作为智慧政府在互联网上的形象代表,智慧政府门户将成为智慧城市发展最为重要的组成部分之一。

智慧政府门户的基础是大数据应用[1]。对政府公共服务而言,大数据之“大”,不仅仅在于其容量之大、类型之多,更为重要的意义在于用数据创造更大的公共价值,通过对海量网民访问数据的深度挖掘与多维剖析,使政府网上公共服务供给更加准确、便捷,更加贴近公众需求,从而使政府网上服务能力得到有效提升,形成政民融合、互动的互联网治理新格局。智慧政府门户以用户需求为导向,通过实时透彻感知用户需求,做出快速反应,及时改进服务短板,主动为公众和企业提供便捷、精准、高效的服务,提升政府网上公共服务的能力和水平。

本文在回顾发达国家在基于大数据提升智慧政府网站服务能力方面成功经验的基础上,结合国家信息中心近年来围绕国家各部委和地方政府网站的大数据分析、服务优化等领域的探索与实践,介绍了政府网站的大数据分析技术及其应用案例。

2.国外现有研究与实践

国外研究者普遍认为,以用户为中心,在深入研究用户需求的基础上提供高质量、差异化的在线服务已经成为全球政府网站发展的基本特征[2]-[3]。基于数据分析来研究用户需求,进而提出网站优化方案,成为国外政府网站建设与管理时研究的重要议题之一。即使是在早期,网站分析工作常面临无法获得精准量化的网站用户行为数据的技术限制,国外学者仍较为注重对网站用户数据的获取与分析工作。Pieter VerdegemGino Verleye等学者主张通过社会调查的方法来研究政府网站用户满意度的影响因素,进而为政府网站提供优化建议[4]。近年来,随着大数据、云计算和智能挖掘等新一代信息技术及商业模式不断成熟,西方发达国家政府网站建设越来越向智慧化、精准化、主动化的方向发展[5]。这种全球政府网上公共服务发展趋势的背后,有着深刻的技术变革背景,那就是近几年来政府网上公共服务分析工具的技术创新,开始朝向基于云模式采集用户行为数据、应用大数据分析平台开展用户行为挖掘的模式[6]转变。近年来,欧美发达国家基于先进的网站智能分析工具,及时发现用户需求热点,精准推送网站服务的做法已经非常普遍,并且取得了良好的效果。

首先,从政府网站分析工具上看,目前美国、英国、澳大利亚、加拿大、日本、韩国、新加坡、荷兰、丹麦、瑞典、挪威、芬兰、新西兰等发达国家中央政府门户网站和联合国门户网站均已部署了基于云服务模式的网站用户行为分析系统。基于这种用户需求挖掘技术,欧美国家政府可以提供更加个性化的政府网上服务,并通过对用户访问规律和点击行为的动态监测,有针对性地改进政府网上服务。

1  发达国家和国际组织政府网站使用的云分析工具一览表

网站名称

网站地址

云分析工具

联合国网站

http://www.un.org/en/

google-analytics

美国政府门户网站

http://www.usa.gov/

google-analytics

iPerceptions

英国首相府门户网站

http://www.number-10.gov.uk/

google-analytics

澳大利亚政府门户网站

http://australia.gov.au/

Urchin

日本首相官邸门户网站

http://www.kantei.go.jp

Urchin

加拿大政府门户网站

http://www.canada.gc.ca

google-analytics

韩国政府门户网站

http:// www.korea.net

google-analytics

新加坡政府门户网站

http:// www.gov.sg

google-analytics

丹麦政府门户网站

http://www.denmark.dk/en

 

google-analytics

Siteimprove

瑞典政府门户网站

http://www.regeringen.se/

google-analytics

挪威政府门户网站

http://www.norge.no/

google-analytics

芬兰政府门户网站

http://valtioneuvosto.fi/

Snoobi

新西兰政府门户网站

http://www.nzgo.govt.nz

google-analytics

其次,在应用先进的政府网站大数据分析技术的同时,发达国家还高度重视相关研究机构和专业团队的建设。以美国为例,其早在数年前就成立了专门从事联邦政府网站数据分析和决策支持研究工作的机构——美国联邦政府网站管理者委员会网站量化分析分会[7]。该机构的主要职责,就是帮助美国各级政府网站开展基于大数据分析技术的用户行为研究和服务优化工作,调研不同网站分析工具的技术优劣势,提供基于用户行为分析的网站决策支持服务,为各级政府网站管理部门提供专业网站分析培训等。自成立以来,该机构发布了多部基于大数据分析技术开展政府网站精准分析和服务优化的研究报告[8],取得了良好成效。

第三,通过应用先进的网站分析技术,发达国家政府网站能够及时、全面、精细地分析网站用户访问行为,对政府网上服务用户的需求特征和行为规律进行深入剖析,有针对性地改进政府网站服务。如美国政府门户网站(www.usa.gov)应用了大量个性化定制服务的相关技术,用户登陆美国政府网站的同时,系统将会自动记录访问者的地址、登陆时间、所用的搜索引擎、所关注的主题、信息、页面等并提供后续的个性化服务。英国政府要求政府网站必须收集访问量、页面浏览量等数据,并在此基础上进行网站运行情况的评估[9]。新加坡政府早在2000年就提出政府网站要利用信息技术,在数据分析的基础上不间断地对用户需求进行良好的反馈[10]。日本政府还基于用户需求挖掘技术,提出“国民电子个人文件箱”的设想,实现世界最先进的“我的专属电子政府”,通过新一代网站用户行为分析系统,帮助网上服务部门及时感知网上服务需求热点,发现政府网上服务短板。这些实践为中国智慧政府门户的建设提供了良好借鉴。

3.本文研究的数据来源

本文所使用的政府网站大数据集合主要来自中国政务网站智能分析云中心。为确保政府网站所属机构隐私信息不被泄露,本文所采用的研究数据仅用于反映政府网站服务运行总体情况,并对涉及具体网站的信息进行匿名化处理,仅保留研究所需要的基本内容。

中国政务网站智能分析云中心是基于国家电子政务外网管理中心云平台建设的,其上运行的中国政务网站智能分析系统(Government Web Dissector, GWD)系列云应用[11]由国家信息中心网络政府研究中心组织研发。截至20146月,中国政务网站智能分析云中心已为中央政府门户网站、国家发改委、农业部、交通部、文化部、人社部、国家卫计委、国税总局、工商总局、质检总局、安监总局、海关总署、国家审计署、国家林业局等部委网站和北京市、上海市、山东省、江西省、河南省、四川省、福建省、云南省、海南省、成都市等地方政府门户网站在内的1800多家政府网站提供数据分析服务,云中心已累计沉淀超过3亿网民的访问行为数据,成为全国首屈一指的政府互联网大数据中心。

在具体研究中,为对全国政府网站总体用户行为和需求规律有一个相对全面的了解,本文选择了较有代表性的82家政府网站进行了统计分析,其中包括10家部委网站、22家省级部门网站、8家省级门户网站、10家市区县级部门网站和32家市区县级门户网站。数据分析时段为201311日至2013930日。原始数据采集总量约5000万条。后文研究中,除非特别说明,否则所有统计样本数据来源均为上述数据集合。

4.基于大数据分析感知用户需求

在服务型政府理念大行其道的今天,我国电子政务系统建设迫切需要提高用户需求分析与需求识别的能力。张勇进[12]认为,“在服务型政府建设理念下,以人为本,坚持公民导向,已成为一种共识,这就要求充分尊重个人或群体的公共行为,重视用户需求的个性化和差异化表达,准确挖掘用户需求,提供最为贴近用户的服务方式”。另一方面,“传统的电子政务建设中,比较重视从系统分析师的角度询问用户的需求,目的是为系统设计提供依据,较少从用户的角度来提供需求,指向用户目前面临的问题,用户的需求和系统的需求、用户的目标和系统的目标经常互不关联,容易出现问非所答,答非所问的结果,这也要求改进需求分析方法”。作为电子政务系统中面向公众提供服务的部分,政府网站的建设和优化更是高度依赖用户需求分析的有效开展。

4.1政府网站用户需求的时空变化

政府网站用户需求与社会公众政治、经济、文化生活密切相关,因此往往带有明显的时空变化规律。因此,在政府网站需求识别框架中,整个分析工作都是在访问时间和页面空间构成的时空轴内展开,不是基于一套静止的截面数据[13]。分析政府网站用户需求的时空变化规律,有助于帮助政府网站制订更加有针对性和动态化的服务策略。以下对政府网站用户需求的时空变化规律进行分析。

1)政府网站用户需求的时间演化分析

政府网站用户的服务需求会随着不同时间段经济社会发展的变化而变化。基于82家样本政府网站用户的需求主题数据,笔者对政府网站用户在20131月到20139月期间访问流量最高的前十名关键词进行分析,如表2

2  政府网站20131-9月份热点需求关键词

月度

需求热点

1

八项规定、收入支出决算表、严控机构编制、食品安全、全国农业工作会议、十二五规划、社保缴费查询、公积金查询、港澳通行证、会计证

2

贯彻落实八项规定、社保审计、生态文明、元宵节、招聘信息

3

乡镇机构改革、国务院机构改革、三定方案、十八大、事业单位分类、部际联席会议、雷锋学习

4

政府机构改革、两会经济热点、春季森林防火、中国梦、雅安地震

5

事业单位分类目录、美丽中国、芦山地震、爱鸟周、毒生姜、百人计划

6

驾照消分新规、事业单位改革、中小微企业、安全生产、神舟十号最新消息

7

特种设备安全法、防汛、体制改革、美丽中国、最难就业季

8

持续高温、行政改革、习近平在河北调研讲话、工业地产政策、群众路线

9

廉洁自律、大气污染治理、城镇化、群众路线、教师节、黄金周

从表2可以看出,不同月份中用户需求热点主要与以下两方面的因素密切相关:一是中央推出的重大举措、重要改革、重要会议、重要政策等。如1-2月份的八项规定及其相关词,1月份的全国农业工作会议,8-9月份的群众路线学习相关词,5-7月份的美丽中国相关词,以及1-8月份持续被关注的各级政府机构和事业单位改革等信息,都是与2013年中央推出的各项重大改革举措密切相关的信息。二是各月份发生的节庆活动、重大灾害、公共事件等与群众日常生产生活关系密切的事件。如2月份的元宵节,4-5月份的雅安地震相关词,5月份的毒生姜事件,7月份的最难就业季,8月份的持续高温,9月份的大气污染治理、教师节等等。

具体到某一类特定用户服务需求,其也会随着不同时间段事件的变化而出现服务需求内容的内在迁移。笔者曾对某农业政府部门网站上用户对于 “玉米”及其相关服务需求主题在一年时间内的变化情况进行了分析。图1显示了访问关于“玉米”的访问人次的变化情况。可以看出,用户对于“玉米”方面的信息需求主要集中在春季和秋季两个时间段。

1 关于玉米的访问人次变化情况

其中,关于“玉米除草”类关键词,其用户需求主要集中在春季时段。这一时期正处于玉米的播种期,因此很多用户对于玉米除草和病虫害防治等信息关注较多。图2显示了“玉米除草”类关键词访问人次的变化情况

2  关于玉米除草的访问人次变化情况

关于“玉米价格”类关键词需求,主要集中在9月份前后。这一时期临近玉米的成熟期,因此很多用户开始关注玉米价格的变化情况。如图3所示:

3  关于玉米价格的访问人次变化情况

通过上述分析可以看出,用户对于某一类农产品信息的需求与该农产品的生长、种植特点是一致的。农业政府网站用户的需求信息与农业生产活动规律高度相关,并且呈现出动态变化的特征。

2)政府网站用户需求的地域差异分析

政府网站用户需求的地域差异性主要由来自行政辖区内外、国内外用户对于一级政府的公共服务需求的差异性所决定。笔者以82家样本政府网站中的省级政府门户网站和省级部门网站为对象,分析了省内用户、国内省外用户以及国外用户三类不同地域用户在各项基本需求分类中的差异性。如图4所示:

4 省级政府网站中不同地域用户需求的差异性

从图4可以看出,不同地域政府网站用户的需求分布具有明显的差异性。例如,政府机构名称、其他机构名称、人名和职务关键词,以及地名区划词等类用户需求中,省内用户的需求明显高于省外和国外用户,说明本地用户更加关心当地的知名企业、政府机构、行政地名和重要人物等信息。而文化旅游词中,省外用户和国外用户的需求明显高于省内用户。这提示我们,对于一个地方性政府网站而言,其所提供的不同类型的服务内容,所面向的用户群体在地域上具有明显差异性,在提供本地区知名企业信息、领导活动信息、地名区划信息时,主要目标用户群体是本地公众;而提供文化民俗、景区名胜、活动赛事等信息时,其目标用户群体则是外地用户。此外,非中文关键词的主要用户群体是海外用户,这说明政府网站提供外文版服务信息,能够很好地解决海外用户的语言问题,对于提升网站国际影响力具有重要作用。

以上是从行政区内外和国内外的角度,初步比较了政府网站用户的地域需求差异性。中国是一个幅员辽阔的国家,各地区经济状态、自然环境、文化习俗等千差万别,不同省份、不同地域用户对于同一类政府公共服务的需求同样存在显著差异性。仍以前文所分析的农业政府部门网站为例,笔者进一步分析了该网站上来自全国各地的互联网用户搜索各类主要农产品信息的地域分布差异性。图5选取了其中六类农产品加以分析:

1.茶叶信息需求地域分布

2.甘蔗信息需求地域分布

3.水稻信息需求地域分布

4.玉米信息需求地域分布

5.枣类信息需求地域分布

6.小麦信息需求地域分布

 

5 六类农作物信息需求的地域分布

从图5可以看出,全国不同地区用户对于农产品类政府网站信息服务的需求具有明显差异性,且这种差异性与农业生产的地域分布规律高度吻合。例如,茶叶类用户需求最为旺盛的均来自茶叶的主产区,如福建、湖南、浙江、广东等地;甘蔗类信息用户需求最旺盛的则主要为热带和亚热带地区,如海南、广东、广西、云南等地;水稻类信息用户需求最旺盛的主要来自东北地区、长江中下游地区和珠江三角洲地区等水稻主产区。这种用户需求与政府网站业务规律之间在地域分布上高度同步的现象提示我们,政府网站,特别是一些面向行业用户提供公共服务的网站,完全可以仿照商业网站的成功经验,设计面向不同地域用户的服务频道,并且根据用户IP地址来源,自动推送符合本地区用户特殊需求规律的服务界面(用户也可按照个人喜好重新选择其他地域),从而有效提高政府网站服务的智慧化和个性化水平。

4.2政府网站用户需求的主题分类

目前,政府网站用户需求信息的主要来源是用户的站外搜索关键词[14]。据笔者对政府网站数据的不完全统计,政府网站用户的站外搜索关键词和站内搜索关键词的数量约为5.51,因此本文着重探讨面向站外搜索关键词的需求分类方法,提出了一套针对用户站外搜索关键词的需求分类框架,对82家样本政府网站的数据进行了分类统计。

1、用户站外搜索关键词语义分类框架

政府网站作为一类较为特殊的公共信息服务网站,其用户需求带有明显的以政府行政工作和社会公共话题为核心的特征。结合对政府网站用户需求的前期调研,本书作者提出了一套面向政府网站用户站外搜索关键词的语义分类框架。将政府网站用户的站外搜索词划分为8类,就各类关键词的包含内容及提取逻辑说明如下:

1)人名职务词。

人名职务词主要包括三部分:

第一类是职务职称词。指关键词中包含各类职务、职称词的情况,如秘书长、区长、审判长、省长、委员、监狱长、调研员等。通过人工梳理的方式总结了党政机构和公共机构的常用职务职称的后缀词库。

第二类是名人姓名词汇。课题组手工收集了政治人物、历史名人、文化名人词、当代社会知名人士等姓名信息共28122条。

第三类是常见人名词,提取逻辑包括以下三类:

A:如果关键词长度=2,第一个字在百家姓中,且不属于其他关键词类别,则将其视为人名词;

B:如果关键词长度=3,若第一个字属于百家姓,或者前两字属于百家姓复姓,且不属于其他关键词类别,则将其视为人名词;

C:如果关键词长度=4,若前两字属于百家姓复姓,且不属于其他关键词类别,则将其视为人名词;

D如果关键词长度>4,则从前往后扫描,如果出现百家姓+常见人名组合,则将其视为人名词。常见人名组合词库的制作方法如下:手工收集了互联网上常见的 150 万个网络人名,提取三字姓名的名称部分,取前 5000 个最常见的名称组合,如婷婷海燕建华丽娜等,构建常用人名组合词库。匹配逻辑,当关键词不属于任何一类其他关键词类别时,且符合上述规则时,则该关键词属于人名词。

2)公务公文词。

公务公文词库包括以下三部分:

第一类是公文及相关文体结尾词。通过人工梳理政府网站用户站外搜索词中常见的公文及相关文体结尾词,如总结、公报、公告、规定、承诺书、策划书、倡议书、告知书、计划书、建议书、结论书、决定书、评价书、申请书、授权书、通知书、同意书、委托书、邀请书等。

第二类是公务员日常工作相关词,如督查、安全保卫、挂职锻炼、监察、突发事件、考评、例会、成果展、示范单位、示范岗、示范点、安全生产月、分类定级、定级、编研、编制、督查、标兵、文明单位等;

第三类是与公务员思想建设相关的关键词,如反思、感想、有感、回头看、创先争优、自我批评、感想、反思、生活会、廉洁高效、带头、廉政风险、惩戒、职务犯罪、职业道德、惩腐、在我心中、自我批评、党建、党课、民主生活会等;

第四类是公务员日常专题工作相关词,如宣传周、标兵、文明单位、先进集体、先进社区、效能提升年、责任落实年、组织建设年、活动月、道德月等。

3)办事服务词。

人工提取关键词结尾符合办事服务词库特征的词。办事服务词库包括以下几类:

第一类是办事动作词,如复查、注销、报到、注册、填报、挂失、罚款、缴存、缴纳、报销等;

第二类是办事客体词,即政府办事服务过程中涉及的各类办事客体,如转办单、通知单、清单、证明单、验收单、转办单、时间表、补缴计算表、额表、电表、注册表、测产表、价表、时刻表、报名表、申领表、税率表、证明表、审批表、申请表、审表、验收表、换证表、合格书、合同书、缴款书、认定书、确认书、结算书、收据、票据、执法依据、收费依据、计税依据等。

第三类是办事事项词,即表示一类办事事项的词,其又可以划分为以下几类:

3 办事事项词分类

分类

代表词

税费缴纳

座机费、报名费、抚养费、检验费、费、工本费、资费、学费、水费、税费、管理费、施工费、工本费、电费、鉴定费、报建费、缴费、收费、手续费、处置费、使用费、购置税、退税、契税、个税、所得税、缴税

证卡办理

公交卡、市民卡、公积金卡、贷款卡、电卡、安置卡、医保卡、办证、上岗证、资格证、合格证、换证、公证、旅行证、通行证、婚证、登记证、许可证、准刻证、代码证、凭证、枪证、权证、光荣证、驾驶证、准生证、结婚证、运输证、失业证、执业证、毕业证、使用证、婚育证、设置证、安置证

社保事项

退休金、保金、维修资金、互助金、保障金、优抚金、公积金、基金、养老金、抚恤金、保证金、补偿金、参保、社保、医保、养老保险档次

购房租房

购房、保障房、廉租房、适用房、经适房、拆迁、二手房、商品房、限价房、公积金封存

其他

户口、电价、年审、安检、年检、牌号、限号、尾号、挂号、选号、摇号、购车、审车等

4)政府机构词。

所谓政府机构词,即与政府部门和事业单位相关的关键词。通过对全国各级各类部、委、办、局、厅、处等政府机构名称及缩写词的梳理,构建了政府机构后缀词词库。通过后匹配的方式,将以政府机构后缀结尾的关键词纳入政府机构词类别中。

5)其他机构词。

所谓其他机构词,主要包括以下几类:

第一类是经营性单位词,即以诸如公司、茶城、咖啡厅、金融城、夜市、营业厅、塑料城、交易会、家具城、酒店、皮革城、菜市场、餐馆等为后缀的词;

第二类是事业单位词,即以诸如医院、文化活动室、托儿所、敬老院、火葬场、看守所、监狱、大学、研究所、中学、信息中心等为后缀的词;

第三类是著名企业品牌词,即以诸如家乐福、肯德基、沃尔玛、三星、富士康、奥特莱斯等知名品牌中文名称为后缀的词。

6)文化旅游词。

文化旅游词的提取方案包括以下三方面:

第一类,是基于上海辞书出版社出版的《中国名胜词典》电子版文档[15],收集全国的4,781条著名名胜古迹名称,采用全文匹配的方式提取关键词,如峨眉山、青城山、都江堰等;

第二类,是提取具有共性的景点结尾词,采用结尾匹配的方式提取关键词,如科技馆、冰雪世界、水上世界、海洋世界、动物世界、海底世界、玫瑰园、动物园、体育城、大舞台、风情街、博览园、博览会、音乐厅等;

第三类,是提取旅游活动内容的关键词,采用结尾匹配的方式提取关键词,如垂钓、采摘、踏青游、短途游、旅行、自由行、好去处等。

7)地名区划词。

地名区划词提取方案包括两条路径:

首先,提取地名区划词的共性结尾,采用结尾匹配的方式提取关键词,如社区、街道、镇、乡、港、经济合作区、出口加工区、科技园区、物流园区、产业园区功能区、发展区、工业区、创业园等;

其次,收集全国寸以上行政区划名称,并采用全文匹配的方式提取关键词。

8)非中文词。

提取用户输入站外搜索关键词中不包含任何中文字符的关键词,并纳入这一类别。

2、政府网站用户站外搜索关键词的主题分类

通过对82家样本政府网站数据统计分析,将目前我国政府网站站外搜索关键词的主题划分为政府机构名称、公务公文词、办事服务类、人名和职务关键词、文化旅游类、地名区划类、其他机构名称、非中文关键词等八类。发现其中政府机构名称、公务公文词、办事服务类用户访问量排名前三,占比分别为26%24%16%,是最主要的需求类别。各类关键词的比例分布情况如下:

6  样本政府网站用户需求情况分布

1)政府机构名称词。这类用户搜索关键词实际上对应的用户行为是通过搜索引擎查找政府网站域名地址,通过搜索引擎访问政府网站首页并继续查找相关信息。这类搜索引擎用户将政府网站信息查找行为划分为两个基本步骤:第一步是通过搜索引擎找到相关政府网站,第二步则是在政府网站上通过浏览或站内搜索等方式继续查找所需的具体服务或信息。因此这一类用户搜索关键词尽管比例很高,在几乎所有政府网站上都属于搜索流量最高的一类关键词,但其并不能直接反映用户的需求主题,而需要继续结合这类用户来到政府网站之后的点击流行为加以系统分析。

2)公务公文词。结合前文所提到的用户需求分类体系框架可以看出,这类用户搜索关键词背后所对应的用户群体很多情况下以公务员用户居多。公务员用户在日常工作中,在需要撰写各种与日常工作相关的文档、报告、表格等材料时,往往会选择通过搜索引擎查找同类型文件作为参考材料。对于这类用户而言,其在搜索引擎上选择搜索结果时,同类型的政府网站相关信息是其首选。从这一分析也可以看出,政府网站应当将公务员用户群体作为本网站服务的一类重要受众加以重视。有条件的政府网站可以尝试推出一些专门面向公务员用户群体的专题服务,如交流园地、公文范文等。

3)办事服务词。办事服务词对应了政府网站上提供的各类公共服务事项信息,这类关键词最能够反映社会公众对于政府网上公共服务的真实需求。从用户需求主题上看,办事服务词中,用户需求量最大的还是与老百姓衣食住行相关的各种事项,如社区管理、交通投诉、出入境手续、公积金等等。

3、不同类型政府网站用户站外搜索词主题分布的差异性

为进一步分析不同类型政府门户网站用户站外搜索需求分布的差异性,此处进一步选取了部委门户、省级门户和市区县门户三类政府网站,比较了上述8类用户搜索关键词的分布情况,如图7所示:

7  三类政府网站用户站外搜索关键词的主题分布差异比较

从图7可以看出:

1)三类政府网站用户中,直接查找政府机构名称词的用户比例分布基本相同,说明这类用户的需求与政府网站业务特征无关,不会因为政府网站的业务层级或业务结构变化而出现波动。

2)部委门户网站用户中,公务公文类用户搜索关键词比重明显高于省级门户和市区县门户。如前所述,由于搜索这类关键词的很多为政府公务员用户,这类用户在选择搜索结果时,往往会出于对信息权威性的考虑而更加倾向于选择部委政府网站上相关信息。

3)办事服务词中,省级门户网站的用户需求比重明显高于部委门户和市区县门户网站。这可能主要是由于两点原因造成的:一是省级门户网站与部委门户网站的业务职能定位各有侧重,部委门户网站国家偏重政策发布、信息公开等内容,而地方门户网站则更加注重在线办事服务的提供。二是省级政府门户网站相比基层政府网站而言,其服务规模和服务水平更高,网站上提供的公共服务事项更加齐全,因此吸引更多有办事服务需求的用户访问。

4)市区县级政府门户网站上的其他机构名称词需求比例显著高于部委网站和省级门户网站。如前所述,搜索其他机构名称词的用户,大多关注各类企事业单位的信息。由于基层地方政府与经济社会的实际运行联系更加密切,基层政府门户网站上往往发布有较多与当地的知名企业、知名品牌、重要公共服务机构相关的信息,从而较好地满足了这类用户的信息查询需求。这也提示我们,越是基层的政府门户网站,其越应当注重与经济社会运行的一线实际密切相关的信息,如本地的名企名品、文化名人、教育机构、社会服务机构、公益机构等等信息,从而满足当地社会公众的信息服务需求。

5.基于大数据分析优化网站服务

随着政府网站大数据分析技术的不断完善,政府网站服务优化工作需要改变当前以定性判断为主、缺乏客观数据支撑“拍脑袋”决策的方式,通过系统、全面、深入的网站数据分析,形成以客观数据为主、经验直觉为辅的决策模式。通过开展网站用户需求和用户行为的数据分析,以真实的用户数据帮助网站管理部门和主管领导准确定位当前网站的服务短板,形成面向网站首页、栏目和具体页面改版优化的针对性建议,确保网站改版方案科学有效。

从用户访问政府网站元素层面的角度,可以将政府网站用户的访问行为从微观到宏观划分为页面元素点击行为、页面间跳转行为和栏目访问行为三个层面。对于单个用户而言,其在一次访问会话期间很可能会同时触发三类行为,比如用户在某政府网站的办事大厅栏目的A页面通过点击超链接来到了信息公开栏目的B页面,则其在这一过程中发生了三个层面的访问行为:首先,用户选择办事大厅栏目页中的某一个超链接,并进行了鼠标点击操作;其次,用户点击超链接之后,网站随之将用户从A页面跳转到了B页面;第三,从栏目的角度看,用户的访问栏目同样发生了切换,即从办事大厅栏目来到了信息公开栏目。

针对上述用户所触发的三个层次访问行为的分析,实际上对应了网站服务运行的三个层面,即页面元素设计(页面内)、服务流程设计(页面间)和栏目体系设计(栏目间)。基于这一考虑,可以从三个层面对基于大数据分析方法的智慧政府网站服务优化方式进行分析。

5.1网站页面设计优化:热力图分析技术

针对单个网站页面,可以运用用户鼠标点击热力图等分析工具对用户访问行为进行深入剖析。所谓点击热力图,就是借助于页面标签等用户行为采集技术,收集访问该页面用户鼠标点击行为的频次、位置等基本信息,并对页面上每一个像素按照其所吸引鼠标点击次数的多少绘制色彩,从多到少依次为黄色、橙色、红色、蓝色和白色。借助鼠标点击热力图分析工具,能够非常直观地反映用户需求热点的分布情况。以下以某质量监督检验检疫局网站首页的“在线服务”栏目的热力图分析为例,介绍基于热力图分析工具优化网站页面设计的基本思路。

质检局网站“在线服务”栏目是网站三大基本功能之一,并汇聚了质检局的各项服务内容。该栏目在设计时,使用了标签嵌套的方式展开信息,基本操作步骤如图8所示。可以分为四个步骤:

第一步:选择办事事项大类方式,包括按业务类别、使用对象、审批方式和办理机构四类。

第二步,选择办事事项小类,如业务类别分类下又包含了产品质量监督、通关、特种设备管理等10类办事事项。

第三步,选择具体事项名称,总局网站默认提供了4条办事事项的办事指南、表格下载、常见问题、结果查询、在线办理和业务咨询的入口。

第四步,如果上述四条办事事项不能满足用户需求,可以点击“more”按钮,查看该小类下的所有办事事项列表。

文本框: STEP4

文本框: STEP3文本框: STEP2

文本框: STEP1

8  某质检总局门户网站在线服务栏目

为考察上述质检局网站在线服务栏目的四个步骤用户使用情况,在首页加载了页面点击热力图分析工具。图9显示了该网站首页“在线服务”栏目的热力图分布情况:

9   某质检局门户网站在线服务栏目热力图

可以看出,步骤2点击比例为8.25%,步骤3点击比例为2.02%。换句话说,就是用户在选择了办事事项小类之后,只有25%的人点击了具体办事事项名称;正常来说,另外75%用户没有点击具体事项的原因,很可能是由于默认显示的4条信息不是用户所需要的信息,因而选择点击“更多”以查找其他信息。但从热力图上看,步骤4more”按钮的点击仅为0.24%。这说明大量用户很可能在选择完服务事项小类之后就流失掉了。

为什么会出现这种原因呢?从用户体验的角度分析,可能有两点原因:首先,旧版在线服务栏目的“more”按钮设计虽然非常美观,但字体过小,位置也不醒目,容易被用户忽视掉。其次,从用户角度看,从步骤1到步骤4,体现了用户使用该栏目的基本行为路径,最符合互联网用户操作习惯的方式,应当是四个步骤的操作区域从上到下依次排开;而目前设计中,步骤4反而跑到了步骤3的上面,这也不符合用户浏览网页的习惯。由于用户在浏览网页时,其在每一个页面元素上停留的时间非常短暂,因此这种设计难以被大多数粗心”的用户发现,导致大量用户流失也就不难理解了。

在基于数据分析发现上述用户体验问题之后,质检总局网站立即针对该问题进行了整改。将步骤4的“more”按钮改为中文“更多服务事项”,使其更加容易被中文用户接受;同时,按钮字体样式大大加大,使用了深蓝色加粗字体,使其更加醒目;第三,将步骤4的位置挪到了步骤3之下,使其更加服务用户使用习惯。如图10所示:

10   在线服务栏目按钮调整后页面

在完成上述改进后,笔者对该网站在线服务栏目的总访问量进行了进一步跟踪。发现自调整上述设计之后,在线服务栏目访问人次有了显著上升,栏目访问效果有了明显改善。如图11所示:

11   在线服务栏目访问情况

5.2网站服务流程优化:漏斗图分析技术

经过十余年发展,目前我国各级政府网站在线服务体系已经初具规模。在政府网站中,办事服务是一种比较特殊的服务内容,一个完整的政府在线服务,会有若干个网上办事环节,这种服务内容组织模式在一定程度上类似于电子商务网站的购物流程。通过分析政府网站在线服务流程各环节的用户访问行为指标,可以借助具体指标来判断网上办事业务的运转是否正常,包括:

1)用户停留时间:分析不同办事流程环节的用户停留时间。对于用户停留时间过长的环节,一方面可以分析造成用户停留时间过长的技术原因和业务原因,增加在线咨询功能、优化业务办理程序;另一方面,分拆这些停留时间过程的环节,并把需要耗费用户大量时间的信息内容独立为一个环节,避免大量出现用户因为填写过于繁琐而出现页面超时等问题,引起用户不满的情况。

2)访问来源:剔除搜索引擎直接引导到具体办事环节、且跳出率较高的用户群体后再开展分析更符合实际情况。

3)新老用户分布:对于仅需一次访问即可办理成功的办事服务,如果出现老用户比例过高的情况,说明办事流程存在不畅的问题。

4)访问者系统环境:对于办事环节中跳出用户,可以分析其浏览器、分辨率等技术环境特征,判断用户流失的原因是否与网站的技术兼容性有关。可以基于办事流程漏斗图分析工具,分析办事流程各环节的转化率,定位转化率较低的网办环节,通过多维度剖析发现问题,进行针对性改进。

5)不同办事环节的用户点击情况。基于用户点击热力图分析工具,可以分析网上办事流程不同环节用户点击行为异常情况,如果出现办事流程之外的区域出现较多点击,则说明网办流程设计存在一定问题。

漏斗图分析是电子商务网站分析中一种较为常见的用于业务流程管理的分析工具。在政府网站办事流程分析中,漏斗图可以清晰地展现政府网站上在线办事的各个环节中网民的路径变化。根据路径转化漏斗图,政府网站监测者可以直观了解每一步业务流程的实现率、流失率,并且可以将漏出的那部分用户选择出来进行多维度数据分析,了解网民流失原因,优化办事流程的设计。以某地方旅游局网站上提供的景区门票在线购买流程为例,从景区门票首页到购物车页面,再到确认订单页面以及最后的付款页面,漏斗图都非常直观地展现了每一流程的流量变化。如图12所示,5.17%的用户从首页来到了购物车页面,70.31%的用户在购物车页面选择继续浏览下一页面,而在付款页面中,94.52%的用户进入了付款页面,顺利完成了门票购买交易。

12 某旅游局网站门票购买服务漏斗图分析

同时,从图12也可以看出,从购物车页面到确定订单页面的用户流失率较高,为29.69%。一般情况下,可以将类似的用户流失率较高的环节称之为业务流程中出现问题的环节。对这部分漏出的用户,可以进一步分析用户的平均停留时间,如果停留时间过长,说明用户在这一环节中可能觉得比较迷茫,需要一些提示性的标语;如果停留时间过短,说明办事步骤可能存在让用户走不下去的情况。在上例中,经过进一步分析发现,从购物车页面到订单页面流量损失的原因在于用户注册和登录环节。该网站服务在用户下订单时,方才提示用户需要登录注册,很多用户觉得过于繁琐,而在该环节选择了漏出。

13 某旅游局网站用户流失的原因分析

5.3网站栏目体系优化:需求相似度分析技术

基于用户的使用数据,引入日志挖掘、社会网络和行为分析等智能化分析手段,通过对政府网站用户使用行为的跟踪与挖掘,可以有效指导政府公共信息服务栏目的设计与优化。通过分析栏目访问群体需求的相似性,合并同类栏目、增加相关栏目之间的超链接和智能推荐等技术导引机制。成都某政府网站曾引入多维尺度分析工具,对网站中的相应栏目进行了调整[16]。以下对该案例加以详细介绍。

所谓栏目需求相似度分析,是通过判断两个栏目的用户群体实际需求的重合程度,并对比两个栏目在实际功能定位和内容主题上的差异性,根据不同情况提出解决对策的研究方法。具体来说,有以下两种情况:

1)栏目A和栏目B分别从属于不同的大厅栏目,并且其政务属性具有明显分别,两个栏目的用户需求高度相似,这表明两个栏目尽管在政务分类上属于不同范畴,但很可能属于用户办事流程的不同环节,因此对于这类栏目,应当在彼此之间增加深度链接机制,从而方便用户在两个栏目服务之间来回切换;

2)栏目A和栏目B分别从属于不同的大厅栏目,其政务属性没有明显差异,两个栏目的用户需求高度相似。在这种情况下,可以考虑将两个栏目合并,并按照突出特色的原则选择合并方向。通过栏目合并的方式,突出网站的特色服务,形成拳头产品。

栏目需求相似度分析的基本步骤是:首先,导出待分析栏目用户的站外搜索关键词列表。其次,编写Java程序,统计栏目两两之间关键词重合的比例,将其定义为栏目的相似性。基本公式是:栏目相似性=两个栏目的共同关键词数/两个栏目的关键词数之和。第三,根据上述结果,形成栏目关键词的相似性矩阵,将相似性矩阵导入SPSS,使用多维尺度分析功能进行可视化分析。多维尺度分析的基本原理,是结点之间以相似性连接(即把相似性定义成节点之间的空间距离)而形成的多维空间,按照一定规则投射到一个二维平面上。

对成都某政府门户网站政民互动的二级栏目需求相似度进行分析,结果如图14所示:

14 成都某网站政民互动栏目的需求相似度分析

从图14可以看出:

1)政府信箱、市长信箱、市民话题三个栏目的用户需求高度相似,说明用户对于上述三个栏目的政务属性差异并不理解,而是倾向于将其视为同一类服务使用。尤其是市长信箱和政府信箱两个栏目,用户在使用时往往会分不清各自的功能差异,而造成不必要的困惑。由于市长信箱栏目是该网站最具特色的品牌栏目,而相比之下,政府信箱和市民话题栏目的使用人数均不多,因此建议将政府信箱和市民话题栏目合并入市长信箱栏目,从而整合资源,充分发挥市长信箱的品牌效应。

2)听证会栏目用户群体需求与其他栏目差异明显。通过分析该栏目用户的站外搜索关键词发现,该网站听证会栏目的无效关键词主题十分散乱,如“新津县太平洋电影院”、“汽车城大道”、 “四川建院”等。说明此类用户所希望查找的并非听证内容,而仅仅是因为主题相似而被“误导”到网站上来。为此,可以建议成都网站在听证会栏目中,增加“相关信息”链接,显示在成都网站的政务公开、办事服务、企事业公开等各个栏目中包含本次听证会主题词的页面标题链接列表,从而有效增加用户黏度。

6.结语

本文结合课题组近年来对政府网站大数据分析和政府网站服务优化方面的实践探索,介绍了当前我国智慧政府门户建设过程中应当着重解决的技术问题和应用案例。希望本文研究,能够为中国智慧城市建设研究者和从业人员提供有益借鉴。

 

 

参考文献

[1] 于施洋,杨道玲,王璟璇,张勇进,王建冬. 基于大数据的智慧政府门户:从理念到实践[J]. 电子政务,2013,05:65-74.

[2] United Nations. United Nations E-Government Survey 2010:Leveraginge-government at a time of financial and economic crisis[R/ OL]. New York, 2010[2010-12-25].

[3] European Commission. 8th e-Government Benchmark MeasurementEuropean Commission Directorate General for Information Society and Media Smarter, Faster, Better eGovernment[R/OL]. 2009 [2010-12-25].

[4] Pieter Verdegem , Gino Verleye. User-centered E-Government in practice: A comprehensive model for measuring user satisfaction[J]. Government Information Quarterly, 2009.

[5] 于施洋,王建冬. 政府网站分析进入大数据时代[J]. 电子政务,2013,08:79-85.

[6] Avinash Kaushik. 精通Web Analytics 2.0——用户中心科学与在线统计艺术[M]. 清华大学出版社. 2011

[7] Web Metrics/Analytics Community[EB/OL]. http://www.howto.gov/communities/federal-web-managers-council/metrics

[8] Digital Metrics for Federal Agencies[EB/OL]. http://www.howto.gov/web-content/digital-metrics

[9] 姚国章. 英国电子政务发展案例[J]. 电子政务, 2005Z6.

[10] 刘会师、曾佳玉、张建光、秦义. 国际领先政府网站的建设经验分析[J]. 电子政务, 2011年第1.

[11] 中国政务网站服务能力建设网[EB/OL]. http://www.gwd.gov.cn/

[12] 张勇进. 电子政务需求识别[M]. 国家行政学院出版社. 2012:5.

[13] 张勇进,杨道玲. 基于用户体验的政府网站优化:精准识别用户需求[J]. 电子政务,2012,08:19-27.

[14] 于施洋,王建冬,刘合翔. 基于用户体验的政府网站优化:提升搜索引擎可见性[J]. 电子政务,2012,08:8-18.

[15] 国家文物局 . 中国名胜词典[M]. 上海辞书出版社. 2003.

[16] 王建冬,于施洋. 基于用户体验的政府网站优化:动态调整栏目[J]. 电子政务,2012,08:28-34.



[1]于施洋,杨道玲,王璟璇,张勇进,王建冬. 基于大数据的智慧政府门户:从理念到实践[J]. 电子政务,2013,05:65-74.

[2] United Nations. United Nations E-Government Survey 2010:Leveraginge-government at a time of financial and economic crisis[R/ OL]. New York, 2010[2010-12-25].

[3] European Commission. 8th e-Government Benchmark MeasurementEuropean Commission Directorate General for Information Society and Media Smarter, Faster, Better eGovernment[R/OL]. 2009 [2010-12-25].

[4] Pieter Verdegem , Gino Verleye. User-centered E-Government in practice: A comprehensive model for measuring user satisfaction[J]. Government Information Quarterly, 2009.

[5] 于施洋,王建冬. 政府网站分析进入大数据时代[J]. 电子政务,2013,08:79-85.

[6] Avinash Kaushik. 精通Web Analytics 2.0——用户中心科学与在线统计艺术[M]. 清华大学出版社. 2011

[7] Web Metrics/Analytics Community[EB/OL]. http://www.howto.gov/communities/federal-web-managers-council/metrics

[8] Digital Metrics for Federal Agencies[EB/OL]. http://www.howto.gov/web-content/digital-metrics

[9]姚国章. 英国电子政务发展案例[J]. 电子政务, 2005Z6.

[10]刘会师、曾佳玉、张建光、秦义. 国际领先政府网站的建设经验分析[J]. 电子政务, 2011年第1.

[11] 中国政务网站服务能力建设网[EB/OL]. http://www.gwd.gov.cn/

[12]张勇进. 电子政务需求识别[M]. 国家行政学院出版社. 2012:5.

[13]张勇进,杨道玲. 基于用户体验的政府网站优化:精准识别用户需求[J]. 电子政务,2012,08:19-27.

[14]于施洋,王建冬,刘合翔. 基于用户体验的政府网站优化:提升搜索引擎可见性[J]. 电子政务,2012,08:8-18.

[15]国家文物局 . 中国名胜词典[M]. 上海辞书出版社. 2003.

[16]王建冬,于施洋. 基于用户体验的政府网站优化:动态调整栏目[J]. 电子政务,2012,08:28-34.

 



主办单位:国家信息中心 京ICP备05063309号 技术支持:中国经济信息网

地址:北京市西城区三里河路58号 邮政编码:100045 电话:010-68557000 传真:010-68533919