IT赋能助提速

——长三角邮件时限监控系统开发纪实
2021-05-18来源:中国邮政网

  长三角邮件时限监控系统主要研究解决省内互寄、长三角城市间互寄标快及快递包裹邮件的全程时限实时监控及逾限邮件责任段落精细判定问题。“实时”是这个系统最大的特点。 

  系统将邮件轨迹数据与标准时限进行实时比较,得出各环节、机构的进出时间和全程时限是否符合要求,并记录每个邮件在各环节的滞留时间。在此基础上,提供业务量监控、时限质量监控、重点业务重点客户分析等6大类、55项图表功能。系统能够监控和评估邮政每一个生产机构的全程时限质量指标和流量流向指标,快速定位进、出、转口环节存在的问题。系统在技术上采用了分布式处理、消息队列集群、Redis集群等主流开源新技术,突破了百亿级海量数据实时处理技术,并在浙江省内首次实现了前后端完全分离、统一身份认证与授权。今年1月11日,由浙江省邮政信息技术中心研发的长三角邮件时限监控系统获得2020年集团公司科技创新成果一等奖。 

  系统于2019年5月上线试运行,至今已两年,为邮件时限质量提升提供了强有力的数据支撑。特别是在逾限邮件监控方面,系统不仅可以呈现每一件逾限邮件的逾限环节及滞留时间、逾限机构和责任人,而且可以对在途邮件进行超时预警,以便在后续流程中赶超,力保全程不逾限。系统实时追踪重点客户的邮件时限,及时发现异常邮件,便于提前和大客户做好沟通解释工作,提升客户满意度。2021年3月,长三角出口快包邮件次日递率由一年前的53.12%提升至85.55%,特快邮件次日递率由一年前的74.08%提升至93.07%。 

  时限质量的提升来之不易,系统的研发也是历尽艰辛。

  2000万条数据,10毫秒响应 技术攻关获突破

  近几年,浙江邮政的快递邮件收寄量均占全国邮政的1/5,而长三角互寄的邮件量占全国邮件量的35%左右。快,是快递业务的发展之魂,只有抓住这个魂,其他一切管理才更有意义。 

  业务发展靠龙头带领,服务时限提升也靠龙头拉动。2019年春节刚过,从集团公司到省里上下一致,严格要求下大力气狠抓长三角互寄邮件的时限质量。为了高效率开展长三角互寄邮件的时限管控和提升工作,浙江邮政立项开发长三角邮件时限管控系统。省信息技术中心总经理顾忠民带队与业务部门多次讨论,确定了业务需求框架。省信息技术中心技术开发部经理范良付勇挑重担,担当项目经理。 

  项目摒弃了以前事后才能追责的管控手段,高标准地要求系统可以实时发现逾限邮件的逾限责任环节和责任人,这就必须用到集团公司实时推送到省里的邮件轨迹。当时,浙江省收寄的长三角互寄邮件每天有140万件,集团新一代寄递平台每天向浙江省推送的邮件轨迹有2000万条。新一代寄递平台采用阿里云架构,利用上百台服务器同时推送数据,高峰时每秒推送几万条,长三角邮件时限监控系统要以区区几台服务器,接纳如此大的数据洪流,保证通道不拥堵、数据不遗失、存储不爆仓、计算毫秒级。毫无疑问,这是整个部门里从来没有遇到过的技术挑战。由于市场竞争形势严峻,决战期只有两个月。 

  困难没有吓倒范良付,反而激起了他的斗志。他一边查阅资料,一边编写测试代码。一种技术路线走不通,就换另一种。那段时间,他白天要处理各种事务,晚上才是他灵感和效率的高峰时刻,经常要工作到深夜11点多。如果遇上难啃的硬骨头,要到次日凌晨两三点才能完成自己制定的当日目标。功夫不负有心人,50多天后,在范良付研读完8个技术组件库的技术文档和源代码,编写完上百个单元测试程序后,终于在有限的硬件资源上实现了预定的目标。

  两年积累,一站式门户 自我革新建平台

  就在范良付啃下后台数据实时处理这块硬骨头时,楼丁阳带领的前端开发团队也传来捷报——一站式包快业务处理平台已构建成功。此前,技术开发部根据IT行业技术发展趋势确定了新的技术路线,之后,部门全体成员通过“骨干攻关,徒弟紧跟”的模式,在不耽误新项目开发的前提下,逐步完成了新技术的换代试用。该项目立项伊始,恰逢天时地利人和之时,部门决定在该项目中全面启用新技术。经过项目团队一个多月的努力,长三角项目不仅实现了单点登录的目标,完成三个包快业务管理系统的优化整合,而且创新设计出配置化的报表开发模式,大幅度提高报表开发效率,原来一个月的工作量,现在一周内就可以完成。 

  最难的几项技术被突破后,项目的按时交付指日可待,团队中每个人悬着的心终于有一点点放松,办公室里紧张的气氛也略有缓解,偶尔能听到大家工作之余的说笑声。

  26台服务器,8200万条数据 “软硬兼施”保发展

  2019年5月,系统试运行后,业务部门的员工惊喜地发现系统功能大大超出他们的预期。长三角所有地市间出口及时赶发率、进口及时妥投率、邮路准点率等十几项指标快速呈现,给业务管理提供了有力的抓手。 

  两个多月后,项目的配套硬件设施到位,系统从临时设备上迁移到新购买的服务器上。如此巨大的数据量,是否有隐藏的性能问题?这一直是范良付所担心的。长三角邮件时限监控系统用到了太多新技术,作为软件开发人员和系统管理人员,范良付必须用“软”的配置让这些“硬”的资源和谐地运作,因此,他一有时间,就钻研系统应用和新技术。系统运行两个月后,数据计算速度确实明显变慢。但是由于有充足的技术储备,范良付只花了两天时间,就让系统恢复了元气。之后,系统一直平稳运行,陪伴全省包快业务管理人员安然度过“双11”、2020年春节和新冠肺炎疫情最严重的时期。 

  谁知,就在系统运行满一年时,新的挑战又来了。一年前,日轨迹数据约2000万条,而现在,日轨迹数据暴增至8200多万条。从去年4月开始,业务部门陆续反映轨迹数据有时会出现少量丢失。这个问题困扰范良付长达一个月之久。那段时间,他像福尔摩斯一样,从硬件设备到操作系统,从集群软件到自己的编码,抽丝剥茧般逐个检查、试验,终于在5月初彻底解决了问题。2020年“双11”期间,经省信息技术中心网管监测,在集团公司到浙江省的数据传输总量中长三角邮件时限监控系统占到1/4,单日系统数据处理峰值达1.4亿条,在海量的数据下,长三角邮件时限监控系统仍然实现了每条轨迹的毫秒级处理,并运行稳定。(策划:何兴利 章思佳 吴传薪 黄芯)