邮政行业大数据应用是中国邮政行业实现信息化、智能化转型的关键。随着信息技术的发展和大数据技术的应用,邮政行业逐步从传统的寄递业务向综合性服务行业转变。邮政行业的大数据应用主要体现在两个方面:一是为管理提供支撑,二是对数据中心建设的需求,这包括数据的集中存储与计算,以及数据资产管理。
数据资产管理作为数据时代的一个重要概念,涵盖了数据治理、数据标准制定、元数据应用、数据加工和数据共享等多个方面。邮政行业内部数据来源分为两大类:一是业务系统内部产生的数据,二是第三方应用数据。业务系统内部积累了大量的历史数据,而第三方数据的引入也在逐渐增加其价值。目前,业务系统内部的业务数据在邮政行业大数据应用中占据主要位置,但第三方数据的应用价值也在逐步提升。
在应用场景方面,邮政大数据应用可以分为以下几类:一是业务数据的即席查询,它允许直接在业务系统中进行明细数据和初步汇总数据的查询,实现系统状况的实时监控。二是数据挖掘,通过引入行业相关的算法和模型进行深入分析,产生业务价值。三是数据资产管理,包括元数据管理、数据质量监控、数据共享以及数据变现渠道管理等。此外,数据仓库的应用涉及数据的统一存储、数据仓库技术建模以及数据集市的应用。
综合来看,邮政行业大数据应用主要基于行业应用系统积累的结构化数据,依托于多年历史数据的价值。构建一个基于OLTP(联机事务处理)+OLAP(联机分析处理)+Hadoop的大数据支撑环境,可以支持在线事务处理、在线分析处理以及分布式存储与计算。邮政行业大数据解决方案的构建,需要深入结合用户的具体业务特征和场景。
中国邮政集团的业务包括普遍服务和便民服务两部分,其中普遍服务确保在人群中提供邮政业务,而便民服务涵盖邮务、速递物流和金融服务等多个领域。中国邮政拥有庞大的业务网络和复杂的数据构成,其中结构化数据占比约20%,而半结构化和非结构化数据占比约80%。数据类型多样,包括客服语音数据、现场视频监控数据、电子凭证数据、金融交易数据、信件报刊数据等。
在中国邮政信息化规划蓝图中,以三大业务板块为核心,围绕战略管理、投资管理、绩效管理、人力资源管理、财务采购管理、风险审计、营销和网络等11个应用支撑板块进行信息化平台建设。为了支持业务系统实现,实现了五大信息化平台,包括战略决策平台、企业集约管理服务平台、风控管理平台、全程全网业务服务平台及核心业务平台。在邮政业务集中化的情况下,省级邮政面临的挑战是如何使用统一平台进行数据整合、分析和管理。
为了满足省级邮政大数据需求,提出了邮政行业省级大数据平台规划,分为核心数据区、分析数据区和历史数据区。核心数据区作为元数据层,通过数据仓库建模技术对数据进行整理编排,形成PData层,结合应用场景和主题形成PMart层;分析数据区用于进行数据分析,提取业务洞察。邮政行业省级大数据平台的设计和实施有助于推动省级邮政数据管理的统一化和规范化,从而提高数据利用效率和业务决策质量。