版面导航:| 新闻资讯 | 统计导刊 | 数说民生 | 经世导刊 | 行业看台 | 汽车时代 | 周末副刊 | 数苑观象 | 地方经济 | 新月刊 |
| 区域观察 | 经济观察 | 城市经纬 | 艺苑大观 | 观点集粹 | 县域经济 | 调查月刊 | 特色产业 | 脱贫攻坚 | 青春之声 | 大数据时代 |
  重点栏目:| 今日评论 | 潘璠视点 |
统计信息化:绽放几代人梦想_中国信息报
当前位置:[新月刊] →返回首页
分享到:微信更多
更新时间:2012年11月30日 09:04:19

统计信息化:绽放几代人梦想

——走近国家统计局数据管理中心
■ 本报记者  周秀玲/文
 
    2012年2月18日零点,中国统计发展的历史迎来了浓墨重彩的一笔——全国企业数据联网直报系统正式开网。这意味着全国约70万家企业从此将通过互联网,直接向国家统计局数据中心或省级数据中心报送数据。这是我国统计生产方式的重大变革,也是统计系统更好地服务社会各界的重要举措。为了这一天,几代统计人薪火相传、孜孜以求,付出了巨大的努力。
    如今,企业一套表联网直报经过一段时间的实践,已取得阶段性的成果。在共享成绩的同时,不禁让人想起那些默默奉献的“幕后”英雄。这样一个庞大的信息化工程是如何建设的?又取得了哪些成效?未来的蓝图如何勾画?
    带着好奇和企盼的心情,记者来到了国家统计局数据管理中心。
突破:改革创新  顺势而为
    回顾中国统计事业改革与发展的进程,可以清晰地看到,技术进步、生产力的发展,对统计生产力的提升和统计生产方式的改变,发挥了重要的支撑和促进作用。统计信息化建设历经30多年的风雨已取得了巨大进展,信息技术在统计工作各领域的应用效果日渐显著,成为提高统计数据质量、提高统计能力、完善统计数据发布、推动统计改革发展的重要手段。   
    30多年前,对于刚刚走上统计工作的人来说,数据处理还处于手工过录、加总和计算机汇总的初级阶段。当时的很多报表都是靠人工把基层表数据抄录到过录表上,再用计算器进行加总。有的老同志还在扒拉算盘珠子。少量的“大数据”正在尝试计算机汇总。要把报表拿到全市唯一的市级计算中心,由专门的录入员进行录入,由专业的编程人员进行数据处理。随着时代的进步,相继出现了王安机、IBM4331、SGI小型机,286、386微机,统计人员可以自己编程、录入,按要求进行汇总。
    国家统计局数据管理中心主任许剑毅说:“过去传统的数据采集方式,是企业将报表报到最基层的统计机构,然后是乡—县—地(市)—省—国家,逐级加工处理,汇总上报,传统的统计生产方式,使原始数据上报过程无法做到公开、透明、可控,中间的环节如果出了差错,容易使数据失真,对统计数据质量产生很大影响。”
    那么如何让原始数据直接上传国家,不再层层接力棒传递,使数据处于“裸奔”状态?这就需要运用信息化的手段、现代技术力量来解决。而探索的道路上总是荆棘密布。当年“一套表”改革由设想成为行动的时候,在哪一级报表、哪一级录入、哪一级报盘,“下去一把抓,上来再分家”。业务流程和组织都成为需要认真考量的战术决策。没有强大的网络支撑,没有统一的处理平台,改革成本巨大,步履维艰。
    如今,当“四大工程”的号角吹响,伴随着领导决策层的高度重视,现代信息技术的突飞猛进,硬件设备的更新换代,软件技术的今非昔比,网络环境的日新月异,国家统计局数据管理中心在信息化建设的路上虽然肩负重任,却也信心百倍。他们经过近千个日日夜夜的努力,终于实现让每一个企业的基础数据,可以沿着四通八达的网络,到达统一的平台,在统一的名录库下,进行统一的加工与汇总。
    2012年,以一套表为核心的统计“四大工程”取得了决定性的进展,并由双轨转为单轨运行。尽管还有很多问题需要解决,还有一些措施需要跟进,但统计生产方式改革的大势已经不可逆转,并一定会随着现代信息技术的进步不断发展和完善。
战略:高瞻远瞩  分步实施
    从统一平台建设形成雏形到一套表数据处理平台的逐渐完善,再到联网直报系统的正式开通,数据管理中心的任务复杂而繁重。翻开数管中心近几年的工作总结,足足有厚厚的一沓,而这些也只是数据管理中心工作的一个缩影,我们从中看到的是信息化建设一步步走来的艰苦历程。
    在这些印记的背后,数管中心始终遵循马建堂局长“统筹兼顾、统一规划、分期建设、分步实施”的指示精神和指导思想。2008年以来,在局党组的正确领导下,以“一网、一台、一库、一整合”为建设核心,扎实推进统计信息化建设,为日后的“四大工程”顺利实施奠定了坚实的基础。
    一是网络基础建设。网络扩建工程一直是基础中的基础,自2008年以来,经过国家、各省局共同努力,国家统计信息网实现了从国家统计局到各省局的主干网扩容提速工程,并顺利完成业务迁移割接。至此,国家统计局到31个省统计局和新疆生产建设兵团统计局的32条骨干线路,网络带宽由原来的2M+1M提升到了155M+ 6M。国家统计局局域网同时也进行了升级改造,核心交换万兆,桌面到千兆。2011年,国家统计局互联网出口带宽由280M扩容增速至500M。国家统计系统的信息交换、数据传输能力实现了质的飞跃,为统计业务的网络化应用提供了坚实的保障。
    与此同时,经过多次试点、联调,先后进行设备、安装、使用等多次培训,完成了全国县以上10万统计人员,每人一个大容量的、基于消息及时通的电子邮箱系统建设。为各级统计系统的数据传输和信息交换,提供了灵活方便的条件和手段。
    建设部署全局的桌面管理系统,强化了系统对个人信息化设备的准入控制和服务能力,增强了系统的安全管控能力。
    二是统一平台建设。统一数据采集软件平台建设稳步前进,取得了突破性进展。2009年,经过充分调研、论证,完成了《统计业务信息化应用系统建设基本框架》和《统计数据采集软件平台建设方案》。根据这个总体思路,在二经普数据处理软件的基础上,进一步改进、完善、开发,整合形成的统一平台,并应用到“R&D清查”、“一套表”、城乡住户一体化以及畜牧业调查等多项统计调查任务上。2010年,经过在湖北等地的试点和不断的修改完善,“一套表”软件在功能、性能等方面都得到了很大改善,得到了各类用户的认可。与此同时,联网直报系统建设也初露端倪。数管中心经过认真研究讨论,制定了《国家统计联网直报系统建设方案》,初步拟定了《国家统计联网直报系统建设任务书》和与各省级统计局、各相关专业司签订的《国家统计联网直报系统建设责任书》,并及时将方案报国家发改委。
    三是数据库体系建设。国家统计数据库如今已经成为统计政务公开的一项重要内容,是社会各界、国内外公众了解统计、查询统计信息的一个重要窗口,受到国内外及社会各界的广泛关注。数管中心在顺利完成国家统计数据库系统软硬件升级的同时,与各专业司密切配合,按月加载发布统计数据,保证了数据发布的及时有效。目前可供用户查询的指标有3770个,报表11009张,数据量约162万笔。2011年,数据库系统再一次进行升级改造,包括系统功能升级,英文版改造。进一步提高和完善了统计数据的对外服务能力,发挥了其在国际上的影响力。在发布库成功的基础上,还基本建成国家统计局数据级带库备份系统,支持直报、名录库、数据库等应用系统备份。此外,为推进数据库省级推广工作,中心工作人员先后赴河南、广东、陕西等地指导、协助当地完成统计数据库建设。目前,河南省、浙江省、辽宁省、新疆兵团、昆明市、嘉兴市统计局等相继实施或完成本地数据库建设项目。
    四是核心业务系统及资源整合。为了满足普查数据处理,大规模企业网上直报,统一数据处理平台部署,系统运行安全(双机热备)的要求,数管中心运用虚拟化、资源池、云计算等先进技术,对统计系统的各类IT资源进行整合。按照WEB服务器池、数据库池、存储池以及虚拟化管理调度的架构,构建了国家统计局大规模联机业务处理和高并发能力的核心业务处理系统,使统计信息的处理能力大幅度提升。此项工作经过一年多的反复方案论证,对国家气象局、海关总署、国税总局、质监局、国土部、水利部等部门进行了充分的调查了解,与IBM、惠普、ORACLE、微软、赛门铁克等知名公司和品牌软件商进行了反复多次的技术交流,最终形成了国家统计核心业务系统及资源整合方案。该项目的整体实施、系统集成工作的完成,使得“一套表”系统、人口普查数据处理系统、经济普查数据处理系统、主要畜禽监测调查数据处理系统、联网直报系统等各类应用系统顺利的迁移和稳定可靠的运行。
挑战:心系使命  知难而进
    2012年2月18日联网直报开通之前,整个数管中心依旧在紧张地忙碌着,自己做测试、请专家做测试。虽然前期的准备工作已经做得很充分,可是大家的心里还是忐忑不安。整个中心犹如一个作战指挥所,许剑毅回想起了当初上任时一位局领导的话语:“联网直报系统和统一的平台建设是一件功在当代、利在千秋的统计伟业,一定要尽全力做好。这是几代人的愿望啊!”就是这样一份沉甸甸的使命让每一个人紧张,又让每一个人振奋。
    许剑毅说;“在最初,很多人觉得许多东西好像都是天方夜谭,是不可能的。但是,我相信,只有想不到,没有做不到。只要确定了目标,逢山开路、遇水架桥,没有过不去的火焰山。”
    其一,攻破技术难关。联网直报系统实现70万家企业同时向国家数据中心报送数据,这是中国统计历史上一个伟大的创举,也是一个里程碑。但是这种系统也伴随着高并发的风险压力,数管中心在技术加工上采用了“13+1”的技术来规避此问题。即在全国建立了13个分节点,国家一个节点,以14个节点分散报送的压力,企业数量比较多的就报送省里面。目前全国有19个省是直接报送到国家,13个拥有企业数量多的省报送到省节点。为了实现在各省建立节点的同时,并保证国家对原始数据的掌控,保证数据质量的目标,各分节点在数据上报上采用“数据同步”的技术,即企业报送到各省的数据,只是作为一个跳板,国家进行实时自动抓取。各级都无法修改企业数据,这样既达到了分布式的部署,也同样控制住了企业的原始数据。另外一个技术突破体现在集群的构架组合上。统计工作的海量数据其实是需要大机器来进行处理的,可大机器的封闭系统,软件是需要租赁的,每年需花费大量的运维费用。于是,数管中心经过反复测试研究,决定采用小机器的集群模式。许剑毅介绍说,虚拟化是把一个大机器分解成几个小机器来完成,而我们恰恰相反,是要将几个小机器整合成一个大机器来使用,用蚂蚁啃骨头方法来实现系统的高性能,解决业务的高并发处理问题。实践证明效果还是不错的。据了解,这种架构从性能和各方面来讲在国内是少有的,也是IBM公司在全球的首个范例。
    采访中记者发现,这套系统建设比起其他的行业相对复杂,既要保证国家的节点,又要保证和13个节点同步。加之系统要同时满足省、满足地市、满足乡县各个层面不同的要求,调查制度在各级都是变化和可再设计的,可谓众口难调。于是,这套系统建设至今依旧在不断地改进和完善,基本上是一个月更新一个版本。除了公共性,更要注重个性化的需要,如界面友好、更人性化、方便易用。技术部门的工作压力始终是很大的。
    其二,克服资金瓶颈。由于“四大工程”国家没有大的专项资金投入,客观形势又不能等和靠。因此,数管中心主要依靠国家和地方统计局现有的资源,先把工作推动起来。例如,通过从经济普查和人口普查中节省的一些数据处理费来进行信息化建设。同时按照这一思想制定了《国家统计联网直报系统建设技术方案》,过渡时期全国统计联网直报系统按照13+1模式建设。即由一个国家局主数据中心和13个省级报送节点构成的物理分散、应用统一的全国联网直报系统。2011年9月,国家统计局办公室正式下发了《国家统计联网直报系统建设技术方案》,指导全国13个省级节点的联网直报系统建设。国家统计局以统谈分签方式,为省级节点采购了软硬件系统及技术支持服务,以保证系统建设的统一性。2011年,新建节点省份的设备采购安装以及应用系统部署工作基本完成,互联网出口带宽也同时进行了扩容。到目前为止,各分省级节点都具备了企业上网报送的稳定运行环境。
    其三,做好安全保障。任何系统的健康运行都需要一个安全的环境,这可能需要从很多方面来考量。数管中心从硬件设施的安全性考虑,采取双机热备的措施。即任何一个节点都不是单一故障点,一台机器出现故障,其他机器自动接起。或者说两三台设备同时在工作。也就是说一个企业将数据报送到数据库的这个过程,没有任何一个地方是单一节点,都是两个以上节点。在公司软件的使