宏观经济大数据系列研究之三:基于移动终端位置数据的企业线下复工水平测算方法研究
来源:大数据部   时间:2020-06-22

摘要:

[目的]为更加及时、有效地量化测算突发公共事件后企业线下复工水平,提供可量化的数据结果支撑相关政策制定和落地实施。

[方法]采用人工与自动化相结合的POI围栏圈定策略,获取931个样本区域内移动终端数量;基于企业生产经营范围内的移动终端位置数量测算复工水平;结合事实和相关数据对测算结果进行验证。

[结果]研究发现2020年春节假期结束后初期,全国样本企业平均复工水平约为2019年同期的三成,截止到今年2月底,样本企业已有约半数员工线下返回工作岗位。

[局限]此次实验样本数量相对较少,且数据分析维度有限。

[结论]本研究所提方法符合突发公共事件后对复工水平动态监测的需要,测算结果有效性得到初步验证。

关键词:突发公共事件;移动终端位置数据;企业复工水平

分类号:G350

DOI: 10.11925/infotech.2020-0322. 

 

1 引言

突发公共事件常常对企业的生产经营产生影响,台风、地震、流行病等都可能导致大量企业停工。在事件影响逐渐消散的阶段,如何有效稳妥地推进企业复工复产是政策制定者和实施者关注的重要问题。掌握现状是精准施策的重要基础,对企业复工水平现状的动态监测能够为稳妥推进企业复工复产相关政策的制定和实施效果评估提供必要的量化支撑。

企业复工水平测量方法主要有以下两类:(1)类似于统计数据的获取,由统计局、行业协会等机构逐级调查汇总;(2)信息服务商基于自身产品的用户数据估算企业复工水平。以上两种策略虽然都具有可行性,但也存在明显不足,如统计数据由于统计周期较长会导致结果具有滞后性,多数服务商数据具有不可避免的样本偏误等。

结合已有方法并取长补短,本文提出了一种利用移动终端位置数据的企业线下复工水平测算方法,并利用真实数据进行了实验。实验结果显示该方法能够有效测量企业线下复工水平,同时具有以下优势:(1)及时性,测量结果的滞后时间不超过12小时;(2)高覆盖率,该方法能够以较低成本覆盖大量企业,进行更全面的测算;(3)可扩展性,因测量颗粒度精确到企业,可通过匹配企业相关各类多源数据不断丰富分析维度。

2 研究综述

2.1 复工相关研究

我国学者对复工的研究大多聚焦于在个体层面,主要侧重于个体伤病后恢复工作的影响因素。冯兰芳、周慧玲等选取57例工伤环卫患者分实验组和对照组从就业准备、复工率及误工时间等进行对比[1]。舒甜、白钟飞等以上海地区457个工伤患者为例,探究其复工的预测因素[2]。周慧玲、黄琼等发现在现场评估样本中,性别、年龄等因素影响职工在不同时间的复工率[3]。在这些研究中,复工均被界定为员工回到工作岗位。

对于突发公共事件中的复工问题,部分学者采用定性方法开展了研究。刘武忠、王祖兵等从职工外地返回、上下班途中、下班回到社区以及出差用人单位外部环节和聚集性场所、共用设施物品、外来访客内部环节进行分析,对复工复产单位新冠肺炎感染关键风险点进行分析评估,并提出针对性的防控建议[4]。胡越秋、王军、董泽华从行为经济学视角利用三参照点理论、决策四力影响因素、前景理论和助推思想等对突发公共卫生事件防控期间企业复工决策行为进行分析[5]

与此同时,国内学者逐渐尝试用不同的定量方法对突发公共事件中的复工问题进行研究李倩、唐彪等利用动力学模型,基于多源数据利用最小二乘法估计系统未知参数,得出复工等正常社会活动的有序开展或将导致缓疫策略执行力与依从性的下降,给疫情的发展带来不确定性[6]。王霞唐三一等基于全国和湖北省新冠疫情报告数据以及百度人口迁徙与分布大数据,构建复杂网络模型,重点分析了武汉及周边地区复工的可能时间节点和复工对二次爆发风险的影响[7]。不难发现,截至目前学术界仍缺少对企业复工水平的分省市动态测算研究。

2.2 移动终端位置数据在相关领域的应用

上世纪90年代,GPS定位数据已经在居民出行调查等领域得到了应用[8],随着集成GPS模块的手机的普及,手机GPS数据逐渐得到广泛使用[9]。与此同时,电信运营商的手机信令定位数据、网络服务商的SDK定位数据以及微博等信息产品中的定位数据等移动终端位置数据正越来越多地应用于社会科学研究。

交通运输等领域已广泛使用定位数据对出行进行测量,该类研究多以不同运输方式中主体特征或主体间关系的特征为核心构建模型[10]。例如,Bohte等提出了基于GPS数据推理和验证出行目的和方式的方法,并在荷兰得到了有效应用[11];李浩等基于GPS、兴趣点(POI等数据分析了上海居民出行时空特征[12];杨彬彬提出了基于手机信令数据的地铁占有率指标,用于评估特定车次的载客强度[13]

位置数据在表征特定地理范围内人口分布与流动等指标的有效性也在实践中得到验证。例如,Yuan等基于POI和移动轨迹,利用主题模型对北京市城市功能区进行了划分并识别了不同功能在不同位置的强度[14]Pan等通过出租车的移动轨迹对杭州市的土地使用情况进行了识别[15];申悦等利用GPS数据研究了北京郊区的两个巨型社区,分析了影响居民在工作日内对城区空间利用情况的因素[16];王贤文等基于腾讯位置大数据分析了京津冀城市群在春节前后等不同时间段的人口流动特征,以及人口流动与地理位置、经济水平等的相关关系[17]

位置数据在突发公共事件研究中主要用于风险定位和灾情影响测算,例如邬群勇等尝试使用微博定位功能、微博正文中的定位信息以及微博数量的变化确定台风灾情位置,并通过实验验证了该方法的有效性[18];史新颖结合DBSCANK-means聚类算法,构建了基于手机信令数据的受灾人口计算模型[19]

位置数据也在就业问题研究中得到了应用。丁亮等基于手机信令数据识别出上海市就业者的工作地和居住地,以此为基础测算出其通勤数据,进而测度了上海中心城区的就业中心体系[20]。王德等利用手机信令数据分析了上海居民就业的空间迁徙情况,验证了手机信令数据在城市人口就业地迁移研究中的可用性[21]。张天然基于上海市数据,验证了手机信令数据在计算就业岗位通勤距离等指标上的可用性[22]。李鹏飞以沈阳市为例,使用核密度、空间自相关等方法,基于手机信令数据识别出城市就业中心,并分析了城市就业空间特征[23]

综上所述,对于突发事件中企业复工水平的测算,目前仍缺少得到一致认可的解决方案。但已有研究表明,职工回归工作岗位是复工问题的核心,而基于移动终端位置数据测量人口分布与流动的研究方法已经在交通运输、城市规划等领域得到验证,同时,此类数据已经在突发事件和就业研究中得到应用,因此基于移动终端位置数据测量复工水平具有可行性。

3 基于移动终端位置数据的企业线下复工水平测算方法

利用移动终端位置数据的线下复工水平测算方法总体可以分为数据获取、复工水平测算、测量结果验证三个步骤,总体研究路线如图1所示。

 

1 总体研究路线

Fig.1 Research roadmap

3.1 特定POI区域范围内移动终端获取方法

为有效获取特定POI区域范围内的移动终端数,首先需要圈定较为准确的POI覆盖围栏范围。由于突发公共事件中企业线下复工水平的测算具有较高的时效性要求,因此在确定围栏范围的过程中需兼顾时间成本以及移动终端位置数据的准确性、稳定性和持续性。以此为出发点,本文在已有研究的基础上设计了应急状态下特定POI区域范围内移动终端数量获取流程,兼顾了人工或自动化圈定围栏方式的优劣势,主要可分为三个步骤:抽样选取待监测POI样本、人工/自动化圈定围栏、利用监测网格持续获取移动终端数量,总体思路如图2所示。

2 特定兴趣点(POI)区域范围内移动终端数量获取方法具体流程

Fig.2 The detailed process of acquiring the number of mobile terminals within specific POI areas

1抽样选取待监测POI样本阶段

针对特定领域、特定区域或特定主体的线下复工水平测算需求,显然能够纳入监测范围的POI数量越多则线下复工水平测算误差率越小,但由于往往期望被纳入监测的POI数量较为众多,而后续圈定围栏会损失一定时效性,为了权衡准确性与时效性,本文根据不同分析需求制定了多种POI样本抽样策略,例如:按POI影响力(例如大型商超或超市网民好评度、企业招聘影响力等)、按POI规模(例如企业注册资本、企业员工规模等)、按POI类型(例如上市/非上市公司、公司所属行业等)或是按完全随机策略选取具有一定代表性的POI样本。

2)人工/自动化圈定围栏阶段

为了兼顾线下复工水平测算的准确性与时效性需求,本文依托面数据区域查询[24]及圆型周边查找方法[25]研究成果,选定了两种根据POI确定对应围栏信息的策略,即人工精准化圈定围栏策略(面数据区域查询)和自动化快速圈定围栏策略(圆型周边查找),根据实际操作经验,人工精准化圈定一个企业围栏约耗时2-3分钟,时间成本相对较低,此外,自动化快速圈定围栏则可实现秒级批量处理,时间成本更低。

 人工精准化圈定围栏策略

对于人工精准化圈定围栏策略,由于圈定围栏过程中的多个环节需要人工介入,时效性较差但准确度相对较高。其主要流程包括利用地图搜索并确认POI对应地理位置、人工根据地图显示POI覆盖范围圈定其围栏范围、将围栏范围转换为8GeoHash编码[24](注:GeoHash位数越多代表围栏精度越精确,目前业界主流采用8位编码绘制围栏范围)、将8GeoHash编码映射至监测网格等,人工圈定围栏示意图如图3所示。其中,为了便于移动终端数量的获取及统计,目前业界主流做法会提前将移动终端定时上报的地理位置数据进行网格化预处理,每个网格大致由38.2米长和19米宽的矩形网格组成[26]

 

3 人工圈定围栏示意图

Fig.3 Schematic diagram of manually determining the fence

 自动化快速圈定围栏策略

相较于人工圈定围栏策略,自动化快速圈定围栏策略的主要流程是:根据POI名称自动化关联映射POI的详细文本地址、根据文本地址与经纬度坐标映射关系库确定POI中心点坐标、设定POI辐射范围半径、将POI中心点坐标及其辐射半径绘制的圆周拟定为该POI围栏范围并转换为监测网格,其中,如图4所示,以半径为50米为例,其圆周共覆盖了11个网格。不难发现自动化快速圈定围栏策略的全过程中人为参与环节较少,虽然准确度会有些损失但时效性较强,可供不同监测需求下综合选取。

4 将中心点坐标及辐射半径转换为监测网格示意图(以半径为50米为例)

Fig.4 Schematic diagram of converting the center point coordinates and radiation radius into monitoring grids (taking a radius of 50 meters as an example)

3)利用监测网格持续获取移动终端数量阶段

无论是人工精准化圈定围栏策略还是自动化快速圈定围栏策略,一旦选定监测网格即可开始持续获取这些网格内的移动终端位置数据,一般情况下,从确定围栏到获取到移动终端位置数据的时间一般不超过12小时,时间滞后性较低。此外,为了尽量减少统计误差,本文只统计在监测网格区域内停留时间超过2小时的移动终端数量,并且将原始数据进行脱敏化处理,只提取了时间、位置和数量信息,所有数据不包含任何个人信息和内容数据。

3.2 企业线下复工水平测算方法

关于突发公共事件后的复工和复工水平,虽然学界已有一些研究,但目前尚未形成统一的定义方式。本文结合已有研究和复工一词的词典定义[27],以2020年初的突发公共卫生事件(以下称“案例事件”)为例,采用如下操作化定义。

复工定义:春节法定假期后,企业员工在法定工作日返回工作岗位。

复工水平定义:已经复工的员工数量在员工总数中的占比,以及这一占比在案例事件期间和非案例事件期间的对比情况。

基于以上操作化定义,本文提出线下返岗率和线下返岗景气度两个指标用以测量案例事件期间的复工水平。返岗率表征已经返回工作岗位员工的占比,计算方法如公式(1)所示:

                 1

因此,需要基于移动终端位置数据测算线下返岗人数和员工总数两个指标。已有研究表明,移动终端设备的数量能够反映人流量,因此本文使用企业生产经营范围内持续停留超过2个小时的移动终端设备数量(以下简称“设备数”)映射企业线下工作的人数。关于线下返岗人数,本文将使用春节假期后法定工作日的设备数进行等量映射,关于员工总数,本文采用春节前正常工作日的设备数进行等量映射。具体测算步骤如下:

1.计算202012日(元旦后一天)至123日(除夕前一天)期间工作日内企业的逐日设备数;

2.对所有企业设备数逐日求和,并以12日数据为100进行标准化,结果如图5所示。从图中不难发现,受春节假期影响,工作日设备数从119日开始出现明显下滑,因此选取12日至117日共12个工作日作为2020年春节前正常工作日。


 

5 2020年年前工作日逐日设备总数标准化结果

Fig.5 Scaled results of the total number of mobile devices on working days before the Spring Festival of 2020

3.计算正常工作日的逐日设备数均值,作为企业正常情况下的员工总数。

综上,本研究中基于移动终端位置数据的线下返岗率计算方法如公式(2)所示:

         2

本文采用以上方法,对2019年的线下返岗率进行了测算,结果(见图6)发现,即使在没有突发公共事件的年份,线下返岗率也不是在年后立即达到100%,而是存在逐步回升过程,整个过程大约持续两周。

 

6 2019年春节后逐日线下返岗率

Fig.6 The offline return rate after the Spring Festival of 2019

因此,为了进一步反映今年春节后线下返岗率受案例事件影响程度,本文提出了线下返岗景气度指标表征受案例事件影响的返岗率与前一年无突发公共事件状态下水平的距离,该指标计算方法如公式(3)所示:

      3

其中,同期以全国法定工作日计,例如2020年春节假期后第一个工作日(23日)和2019年春节假期后第一个工作日(211日)为同期。线下返岗景气度得分越接近1说明越接近正常水平。

3.3 企业线下复工水平结果验证方法

关于案例事件期间的企业复工水平,仍缺乏统一的定义和测算口径,更没有持续的权威数据可供比对,因此如何评估测算方法的有效性成为本研究的一大难点。本文采用以下两种方法解决这一问题。

基于事实验证。本研究的目的是识别复工水平,为相关决策提供量化支撑,因此测算结果的可解释性以及与事实的契合度应作为结果评估的重要标准。本文拟通过不同角度将测算结果的特征与案例事件期间的事实进行比对,评估两者的符合程度,测算结果与事实的符合程度越高,则测算有效性越高。但这种验证方法无法摆脱事后解释的困境,因此仍需进行量化验证。

基于相关数据验证建构效度。建构效度用于评估“测量工具是否反映了概念与命题的内部结构”[28],其核心思想是如果两个理论上存在相关性的概念在测量结果上也相关,则更有信心认为测量结果是有效的。本研究使用的相关概念对是线下复工与城市内出行,因为线下复工与通勤是相伴的。城市内出行数据方面,本文使用了百度地图公布的城市内出行强度和滴滴出行公布的城市交通活力恢复指数。如果测算结果通过了建构效度检验,就有更充分的证据表明本文提出的测算方法是有效的。

4 实验数据与测算结果

4.1 实验数据介绍

为了利用真实数据对案例事件期间线下复工水平进行测算,本文根据职友集网站(www.jobui.com)公开发布的各城市企业排名,抽样选取了600个大型企业样本,同时,根据高德地图(www.amap.com)搜索“写字楼”的排名情况,抽样选取了331个写字楼样本。因此,大型企业及写字楼的总实验样本量为931,为了确保覆盖率和代表性,实验样本涵盖了除港澳台以外的31个省份。

此外,考虑到企业办公地址较为复杂,本文对企业样本采用了人工圈定围栏策略,对写字楼样本采用了自动化快速圈定围栏策略。并基于931个实验样本,选取了201911日至331日及202011日至229日两个时间段内共150天,获取了在围栏区域内停留时间超过2小时的移动终端数量作为复工水平测算的基础性数据。

4.2 测算结果

本文使用3.2节的计算方法,对20202月全国及分省样本企业复工水平进行了测量。部分测算结果如下。

从全国总体水平来看,样本企业线下复工水平稳步提升。如图7所示,23日节后第一个工作日,线下返岗率仅为18.38%,线下返岗景气度为0.29,复工水平约为2019年的三成。自210日起,随着绝大多数省份解除对企业复工的政策限制,线下返岗率出现大幅上升,此后每周上升约10个百分点,至228日已达50.4%,即已有约一半的员工在线下返回工作岗位。从第三周开始,由于基期(2019年)线下返岗率已回到正常水平,线下返岗率和线下返岗景气度结果基本一致。

 

7 20202月全国样本企业线下返岗水平测算结果

Fig.7 The measure results of the offline resumption level of all samples in February 2020

228日, 31个样本省份中,半数以上省份样本企业的线下复工率已超过50%。截止到2月底,从线下返岗率来看,尚无省份超过80%,甘肃、福建、吉林等8个省份超过了60%,多数省份在40%60%之间,除此之外,北京为38.76%,新疆为25.83%。对于案例事件影响最为严重的湖北省,由于采取了严格措施管理人口流动,湖北省样本企业的复工水平虽然节后第一周接近于全国整体水平,但在全国持续回升的过程中,湖北的复工水平却一直在低位徘徊,其228日的线下返岗率仅为19.22%

1 2020228日各省样本企业线下返岗率分布

Table 1 The province distribution of the offline return rate on February 28, 2020

线下返岗率

省份数量

省份

[60%,80%)

8

甘肃、福建、吉林、陕西、山东、辽宁、云南、海南

[50%,60%)

9

江苏、青海、内蒙古、宁夏、安徽、贵州、浙江、湖南、江西

[40%,50%)

11

四川、山西、广东、河北、上海、广西、河南、天津、西藏、重庆、黑龙江

[20%,40%)

2

北京、新疆

[0%,20%)

1

湖北

 

5 测算有效性验证

本节将结合事实和城市内出行数据,对线下返岗率的测算结果进行验证,因线下返岗景气度只是在前一步的基础上计算同比变化,此处不再单独验证。20202月全国和湖北省的线下返岗率测算结果如图8所示。

 

8 20202月全国及湖北样本企业线下返岗率

Fig.8 The offline return rate of all samples and samples in Wuhan in February 2020

 

5.1 基于事实定性验证

总体来看,测算结果的主要特征与案例事件期间的事实高度相符,具体表现在以下几个方面:

从总体趋势上,全国呈现上升趋势,但湖北省相对平稳。线下返岗率测算结果表明,全国复工水平呈总体上升趋势,与国家发展改革委公布的规上企业复工趋势[29]相符。而与此同时,受案例事件影响较大、人口流动管理政策更加严格的湖北,其返岗率和返岗景气度在今年2月期间均未出现明显的上升趋势,符合事实特征。

逐周对比来看,第一周湖北与全国复工水平差距较小,第二周开始差距逐渐拉开。虽然春节假期后的法定工作日是从23日开始,但上海[30]、浙江[31]等超过20个省份都规定各类企业不早于2924时复工,北京[32]等省份也建议在20202924时前各类企业灵活复工。由此可见,多数省份都是在210日之后正式复工。从测算结果来看,春节假期后第一周,全国和湖北的复工水平均较低,二者差异不大,但从第二周开始,全国复工水平开始逐步上升,结果与事实相符。

逐日对比来看,第一周内出现了逐日下降的特征。由于测算所用底层数据精确到单台设备,所以能够敏锐地捕捉复工水平的逐日变化。从测算结果逐日变化来看,仅第一周的复工水平出现了短期小幅下滑,这与当时部分企业违规复工被查处、因防疫设施不足再次停工等事实[33]相符合。

5.2 基于其它来源数据定量验证

线下复工与市内通勤高度相关,因此城市内出行数据可视为复工相关数据。本节将结合百度、滴滴等大型互联网公司公布的相关数据验证基于移动终端位置数据的线下复工水平测算方法的有效性。

1)与百度迁徙城市内出行强度指数对比

百度迁徙城市内出行强度指数是各个“城市有出行的人数与该城市居住人口比值的指数化结果”[34],该指数反映了城市内逐日出行强度的变化,但没有计算春节假期前后的强度的比值。为保证对比的一致性,本研究采用与线下返岗率相同的方法对百度迁徙城市内出行强度指数进行计算,将其命名为“出行恢复度”,四个直辖市2月份的测算结果对比如表2所示。

2 线下返岗率与出行恢复度对比

Table 2 Comparison of the offline return rate and the travel recovery indicator

城市

指标

均值

全距

方差

Pearson

相关系数

北京

线下返岗率

0.29

0.26

0.01

0.96

出行恢复度

0.34

0.21

0.00

重庆

线下返岗率

0.23

0.30

0.01

0.89

出行恢复度

0.41

0.21

0.01

上海

线下返岗率

0.27

0.34

0.01

0.99

出行恢复度

0.40

0.34

0.01

天津

线下返岗率

0.27

0.29

0.01

0.95

出行恢复度

0.36

0.22

0.01

从表中可以看出,四个直辖市的线下返岗率和出行恢复度均高度相关,初步验证了数据有效性。从具体数值来看,四个直辖市线下返岗率的均值都低于出行恢复度,而其全距则没有低于后者,说明二者代表不同含义。

以线下返岗率为因变量,出行恢复度为自变量的一元线性回归结果(见表3)显示,这两个指标在四个直辖市测算结果均显著正相关。因此,如果百度迁徙城市内出行强度指数是对城市内出行的有效测量,则可以认为本文测量结果通过了建构效度检验。

3 线下返岗率与出行恢复度回归分析结果

Table 3 Regression results of the offline return rate and the travel recovery indicator

因变量

自变量

回归系数

标准误差

变量P

模型P

北京

线下返岗率

截距

-0.17

0.03

0.00

0.00

北京出行恢复度

1.35

0.10

0.00

重庆

线下返岗率

截距

-0.29

0.06

0.00

0.00

重庆出行恢复度

1.27

0.15

0.00

上海

线下返岗率

截距

-0.13

0.01

0.00

0.00

上海出行恢复度

0.99

0.03

0.00

天津

线下返岗率

截距

-0.25

0.04

0.00

0.00

天津出行恢复度

1.46

0.11

0.00

2)与滴滴城市交通活力恢复指数对比

虽然与出行恢复度的对比得到了较好的结果,但此处无法验证百度迁徙城市内出行强度指数的有效性。因此,本研究引入与滴滴城市交通活力恢复指数的相关性分析,进一步检验测算结果的有效性。滴滴城市交通活力恢复指数“基于滴滴出行平台海量轨迹数据、交通运行指数(TTI)等出行数据,进行拟合、交叉验证、加权处理后得出,可科学客观地反映出城市交通的活跃度[35]。因为本文数据采集时,四个直辖市中,滴滴城市交通活力恢复指数的公开数据仅覆盖上海和重庆,以下以这两个城市为例进行验证。线下返岗率与滴滴城市交通活力恢复指数的对比如表4所示。

4 线下返岗率与城市交通活力恢复指数对比

Table 4 Comparison of the offline return rate and the urban traffic vitality recovery index

省份

指标

均值

全距

方差

Pearson相关系数

重庆

线下返岗率

0.23

0.30

0.01

0.93

城市交通活力恢复指数

0.09

0.15

0.00

上海

线下返岗率

0.27

0.34

0.01

0.96

城市交通活力恢复指数

0.18

0.26

0.01

从重庆和上海的结果来看,线下返岗率与城市交通活力恢复指数也是高度相关的,指标间的Pearson相关系数在两个城市均超过0.9。从具体数值来看,线下返岗率的均值和全距相对较高。

从回归分析的结果(见表5)来看,除重庆模型中的截距项外,其它变量均显著正相关,再次验证了线下返岗率测算的有效性。

5 线下返岗率与城市交通活力恢复指数回归分析结果

Table 5 Regression results of the offline return rate and the urban traffic vitality recovery index

因变量

自变量

回归系数

标准误差

变量P

模型P

重庆线下返岗率

截距

0.02

0.02

0.38

0.00

重庆城市交通活力恢复指数

2.32

0.22

0.00

上海线下返岗率

截距

0.04

0.02

0.04

0.00

重庆城市交通活力恢复指数

1.30

0.09

0.00

3)验证数值有效性

不难发现,以上几种方法都只是在变化规律层面验证了线下返岗率测算的有效性,而没有验证单个独立数值的有效性,即无法判断228日全国线下返岗率为50.40%这样单一数值是否准确。对于这一问题,理想的解决方案是跟权威数字进行对比,但在研究中并未找到可用于比对的权威数字。虽然官方公布了规上企业复工率之类等相关指标,但存在以下两个问题:第一,所公布数据的口径未知;第二,所公布数据不够连贯。

本研究所提出的方法,能够以企业为单位进行测算,进而判断每个企业是否复工,但由于无法获得官方判断企业复工的标准,因此无法采用相同标准将线下返岗率转化为企业复工率,例如将企业有1人返岗即视为复工和超过50%的人返岗视为复工则会得出完全不同的结论。同时,即使能够测算出复工率,由于可对比的官方数据较少,少数几个点的对比不具有统计意义。因此,单个独立数值的有效性本次并未得到验证。

虽然如此,相对于基于出行等数据的测算,本研究提出的测算方法与复工这一问题的关联更为直接,因此其数值更可能反映实际复工水平。一方面,以企业为单位获取数据,在概念上与企业复工更为契合。另一方面,本研究所用数据都精准定位到了企业生产经营范围内,直观地测算了线下返回工作岗位的人数。与此同时,如图6所示,2019年年后的线下返岗率逐步恢复并稳定在100%上下小幅波动,符合经验判断,说明虽然具体数值存在小幅误差,但总体能够表征实际返岗水平。

与此同时,需要指出的是本次实验的结果可能存在一定误差。一方面,本次使用的实验数据样本量较小,重点覆盖了具有一定规模的企业和知名写字楼,样本对农村地区的代表性不足,因此结果可能更接近于城市内企业的线下复工水平。此外,由于在一些情况下移动终端数不等于人数,例如一个人拥有多台移动终端等,在使用移动终端数量近似测量人流量时或存在一定误差,虽然通过突发事件前后及两年间的对比能够在一定程度上缩小这一误差,但无法将其完全消除。

 

6 结语

为了更加及时、有效地测量突发公共事件期间企业复工水平,本文提出了一种基于移动终端位置数据的企业线下复工水平测算方法,并使用931个样本数据进行了实证研究,主要研究如下:

1)本研究所提方法能够低成本、大量、快速地获取企业生产经营范围内的人口流动数据,能够在12小时内计算出前一天的线下复工水平,符合突发公共事件期间对复工水平动态实时跟踪监测的需要;

2)基于事实和相关数据的验证结果显示,本文所提方法具有一定的有效性,一方面,测算结果能够较好地解释现实特征,另一方面,测算结果通过了建构效度检验,与城市内出行数据呈显著相关。

本次实验阶段仍存在一些不足,例如所用样本较少,对总体的代表性仍需进一步验证;所用数据维度较少,无法全面反映线上线下综合复工水平;测算结果具体数值有效性的验证仍有不足等。在后续研究中将通过扩大样本量、丰富数据维度、增加验证标准等方法对研究进行深化。