算法驱动 数据赋能

济南局为纳统提质 插上智慧翅膀

版次:04 来源:中国信息报    2022年06月23日

  天桥区统计网格员走访企业

  ■ 吴春燕 王瑞云

  今年以来,山东省济南市统计局全面提升统计智慧化水平,选取了天桥区先行先试,搭建“准四上”单位跟踪监测系统,在运算方法和数据处理上开拓创新,实现多个技术突破,用大数据为“四上”企业纳统工作提质增效。

  济南市“准四上”单位跟踪监测系统和企业微信整合了市场监管、税务等部门的数据资源,形成“1+3+3+N”的智能信息化体系,即以建设监测系统1个平台为中心,利用统计地理信息、行业代码、产业代码智能编码3个数据库,形成基本单位名录库、准“四上”企业培育库、扶持政策库3个数据库,实现企业信息电子采集、名录库智能维护、数据可视化等多个应用功能。

  针对在调查普查中行政区划代码不准确、基层走访核实任务无法有效分解等问题,济南局运用正则表达式和经纬度匹配相结合的方法,实现企业经营地址精准匹配,为山东省首创。首先收集各街道地址信息,根据关键字编写正则表达式模板,进而实现对地址字段的批量处理。同时,利用高德、腾讯、百度等第三方地图供应商提供的API开放接口,将地址转换为经纬度坐标,使用Geopandas、Polygon等Python三方扩展包计算经营地坐标所属的行政区域,与正则表达式匹配结果相结合,实现了普查调查任务的精细划分和企业地址的精准定位。

  以跨行业、跨部门的数据共享机制为依托,济南局将“准四上”单位跟踪监测系统与统计基本单位名录库对接,构建了名录库智能更新机制,实现准“四上”企业库自动生成。综合使用多元Logistic回归统计方法和深度学习算法,在整合部门数据的基础上,以企业主要经营指标为变量,训练多层神经网络模型,实现横向、纵向间数据匹配性整合、验证和控制,判断企业经营规模和活跃度,智能筛选生成准“四上”企业储备库。将名录库维护等工作交给系统来完成,切实减轻基层工作负担,显著提高“上规入库”效率,为行业部门开展优质企业孵化培育提供了信息化技术支持。

  济南局利用地理信息系统等技术对系统内各行业统计数据进行分析和挖掘,为主要经济指标赋予空间维度。利用莫兰指数计算评估统计指标的自相关程度,通过曲线图、散点图、冲积图等形式,形成行业热力分布、重点企业聚集度等多元可视化地理画像,有利于充分展示区域经济发展状况,实现监测平台数据多元化展示。

  据济南局介绍,通过平台内嵌的综合数据分析模块,还可按照不同需求提供定制化服务,形成详细的经济发展宏观数据图像,帮助各级领导和统计人员准确分析研判趋势,更好地发挥数据监测和预测预警效能,为经济社会高质量发展提供更智能、更高效、更优质的统计服务。

作者:吴春燕 王瑞云
此报纸需要付费才能观看
激活报卡 购买报纸
激活成功后,该报卡号将与您的账号绑定,将不能取消或者修改
已激活成功