版面导航:| 新闻资讯 | 统计导刊 | 数说民生 | 经世导刊 | 行业看台 | 汽车时代 | 周末副刊 | 数苑观象 | 地方经济 | 新月刊 |
区域观察 | 经济观察 | 城市经纬 | 艺苑大观 | 调查月刊 | 特色产业 | 脱贫攻坚 | 青春之声 | 大数据时代 | 法治利剑 | 统计战“疫” |
  重点栏目:| 今日评论 | 潘璠视点 |
有效 准确 价值_中国信息报
当前位置:[大数据时代] →返回首页
更新时间:2020年01月15日 08:54:56

有效 准确 价值

——比利时移动电话数据作为统计数据来源的质量评估

    移动电话数据是官方统计机构最具前景的大数据来源之一。最新研究表明,移动电话数据可以在人口统计、人口迁徙情况、旅游统计、流动人口统计等领域作为官方统计机构传统数据的替代性来源。
    比利时统计局、欧盟统计局和比利时电话移动公司Proximus联合以现有实际人口为重点,利用移动电话数据(由比利时大型网络运营商Proximus提供)进行了人口密度估计,并与既往人口登记册为基础的比利时人口普查结果进行了比较。研究表明,移动电话数据集能够提供有效和准确的统计信息,可以作为官方统计数据的补充,但同时也存在一定的局限性,还需要不断地改进和优化方法。
    
    移动电话数据的理论基础
    
    对于移动电话数据的构成,目前大多数研究(如,欧盟委员会,2014)都侧重于以计费为目的的CDR(呼叫详细记录)数据,CDR能够显示移动电话使用的时间和位置。比CDR详细的数据是网络探测系统捕获的所有的信号事件(包括非计费信号交换)。就Proximus网络而言,有用信号事件数据量要比CDR数据量高出10倍左右。网络上每台设备至少每3个小时被记录一次位置,通过主动的数据连接,这种间隔大约可减至每小时一次。在实践中,这种信号交换会记录得更加频繁,经常悄然连接网络的智能移动电话更是如此。此外,随着5G等技术的出现,可以获得的位置样本也会增加。当设备从一个位置区域移至另一个位置区域并进行位置更新时,这种间隔会进一步缩短。
    在移动网络中,每次信号交换时,移动电话的位置信息都可精确到蜂窝识别码。移动电话网络是一种越来越复杂的蜂窝系统,一个通信基站通常包含多种技术(2G,3G,4G,5G)和多个蜂窝。
    
    移动电话数据具有有效、准确、价值性的特点
    
    有效性:移动电话数据是评估人口密度的有效来源。移动电话数量与人口普查所得人口密度的相关性在夜间约为0.85,白天这一数字会显著减少,这种高度相关性表明人们居住地是移动电话过夜之地的理论假设。夜间移动电话的映射地图与基于登记册的人口密度之间惊人相似,尽管这两个来源都存在无法避免的差异和不准确性。移动电话数据的局限性在于:并非人人拥有移动设备,一些人会同时拥有多部;仅使用一家移动网络运营商的数据具有局限性,其市场份额虽高但并不完整,且存在地域可变性;人们及其移动电话并非每晚都在居住地(可能在旅游、住院、值夜班等)。另一方面,人口登记数据会存在时间延迟或缺乏完整性,因为有些居民没有登记,或通常居住在非户籍登记地。
    两种数据同时又各具优势:人口登记数据较为完整,因此在很大程度上具有代表性;而移动电话数据能够实时记录真实情况,不会受到无应答或非登记偏差的影响。综合利用两种数据来源的优势,可以认为统计结果会比单独使用更有效、更准确和更及时。
    准确性:基于移动电话数据和人口普查数据的人口密度相关性较高。夜间约0.85的高度相关性表明,两个数据集都能在一定程度上准确估算当前实际人口。如果差异可通过辅助数据集加以解释和系统消除,相关性会进一步增加。但无论是居住区域还是工作区域,还应使用其他空间和/或时间数据(比如土地使用、事件日历、气象条件、时间利用研究)来进一步提高估算某一时间点实际人口方面的准确性。
    价值性:利用辅助数据集提高移动电话数据的价值。任何与移动电话数据集重叠的空间和时间数据集,都可用来验证和辅助判断由移动电话数据带来的偏差。这些辅助数据集包括气象数据、日历(假期、事件)、土地使用(包括公路、铁路、火车站)和其他地理编码数据集、特定地点和时间的事件信息等。
    
    官方统计数据的有益补充
    
    利用移动电话数据与人口普查数据进行人口估计的比较表明,它们均是接近实际现有人口的有效和准确来源。移动电话数据还具有实时性,易于计算,不依赖于主观响应的优点。结合其他时空数据集,将进一步提高此类数据在这方面的应用水平,不仅可以更好应用于人口统计,而且也可在劳动力流动与迁移、旅游统计等领域大有作为。
    从统计学角度来看,移动电话数据也带来了挑战。比如,这些数据本身新颖,大多未经查明,可能以未知和不可知的方式造成偏差(比如人与设备之间并非一一对应,网络并未覆盖全部人口,选择性地对待年龄、性别等重要变量)。其他问题还包括跨时段数据存取,数据集的大小(取决于统计机构的存储和处理能力)、预处理相关信息等。最重要的还包括隐私和其他法律方面担忧的化解,比如数据所有权或对网络运营商的保密承诺等等。
    将移动电话数据并入官方统计数据的关键在于统计机构应与移动网络运营商建立一种互利合作的伙伴关系。如此,官方统计数据大有用武之地,运营商亦可深度挖掘自己的数据并可能获得其他有价值的数据集,双方均可从中获益。
(国家统计局统计科学研究所 丛雅静编译)

 
[近期推荐]
· 国有企业改革步入关键期...
· “大国体检”摸清家底 经...
· 国家统计局“不忘初心、...
· 国家统计局召开局党组扩...
· 明确目标任务 加强组织领...
 
[联系我们]
中国信息报记者名录

新闻热线:(010)63376728
广告热线:(010)63376800
发行热线:(010)63376723
举报电话:(010)63376713

中国产业报协会
产业报行业报新闻道德委员会
举报投诉电话:010-65573925
举报投诉邮箱:xwddwyh@126.com

报社简介 | 广告刊例 | 投稿信箱 | 记者名录 | 新闻记者证管理办法 | 报刊记者站管理办法 |
通讯地址:北京月坛南街57号国家统计局中国信息报社 邮政编码:100826
网址:http://www.zgxxb.com.cn 中国信息报社版权所有
京ICP备06043878号-2