" 他总是眺望着地平线之外的机遇,心中有一个更大胆的构想正在萌芽。"
2006 年,在美国西雅图的亚马逊总部,Amazon Web Services ( AWS ) 的首个产品 Amazon S3 横空出世,原本只是为了解决互联网泡沫后的计算资源过剩问题,AWS 却凭借这一契机,成长为全球首屈一指的云服务平台,书写了科技界的传奇。
同是源于对创新的执着与对卓越的追求,快递 100 的故事也始于一次意外的灵感闪现。一次客户调研中发现的痛点,激发了团队的灵感。2010 年,快递 100 的第一个版本就此诞生。
在 6 年之后的 4 月,快递 100 收件端 APP 上线,成为快递员 / 网点经营者提供跨快递品牌的一站式揽件工具和网点经营平台;如今的快递 100 收件端已经汇聚了超过 130 万注册快递员及网点经营者。然而,随着业务的蓬勃发展和需求的多元化,确保高峰时段系统稳定与响应速度的挑战,犹如暗礁,悄无声息地考验着快递 100 的韧性。
在此背景下,针对收件端系统不稳定的问题,历经 102 天夜以继日的努力,团队已全面解决这一问题,如今,快递小哥们可以毫无后顾之忧地在收件端进行打单发货,服务体验显著提升,而这背后折射出的是快递 100" 以客户为中心 " 的不变价值观以及其强大的快递物流信息基础能力。
01 130 万用户蜂拥而至的 " 幸福挑战 "
数字化时代,随着用户数量的激增和应用场景的多样化,网络服务面临着前所未有的挑战,尤其是在高并发请求的场景下,如何保证系统的稳定运行和高效响应成为了一个亟待解决的问题。以近年来的 " 双 11" 购物狂欢节为例,每分钟都会引发数十亿次的访问请求和交易操作。
事实上,在互联网行业,高并发请求导致服务器崩溃的事件并不罕见,例如前几年 YouTube 出现全球范围内宕机事故,YouTube、YouTubeTV 和 YouTube music 都被波及,大约半小时才恢复。早年间微博每逢重大热搜便开始显示系统崩塌,也是由高并发请求导致。
YouTube 宕机时所发布的声明
在极端的高并发场景下,平台必须确保其后端服务能够承受巨大的流量压力,同时保持快速响应和高可用性。这不仅是对技术团队的一次大考,也是对整个平台基础能力的一次严峻考验。
自 2010 年诞生以来,快递 100 C 端产品累计注册个人用户超 2.7 亿、P 端产品累计注册快递员和网点经营者超 130 万、B 端产品及解决方案累计服务电商企业 / 泛电商企业 / 品牌企业 / 政府与公共组织等客户超 250 万家。
作为收件端拥有 130 万用户的快递 100,在重大节假日及业务高峰期,收件端面临着显著的系统稳定性考验。此时,大量用户涌入,对服务器构成了巨大压力。
此外,收件端业务集成的多个复杂功能,包括过多的分支判断和异常处理机制,显然加大了系统的复杂度,使得问题定位变得更为困难。加上原有的开发架构和技术栈存在局限性,服务单节点性能不足,甚至影响了数据库的正常运行。这些都进一步加剧了快递 100 收件端的不稳定性,对业务连续性和用户满意度产生了较大影响。
02 102 个日夜的攻坚备战
快递 100 收件端始终以快递员群体为中心,致力于为小哥们提供稳定、高效、便捷的服务。洞察到快递小哥遇到的一系列痛点难点,于 2023 年 12 月迅速成立了专项组,集中了最优秀的技术力量,通过优化系统架构对系统不稳定的问题进行了专项攻关。
快递 100 通过统一技术栈,框架规范化,增加设计评审、引入预发布环境,接口级灰度,实现 7x24 小时发布、接口规范化,提升全链路监控能力、注重流程分析、文档留存、团队建设等多项具体使得内部系统性能得到了极大优化。
架构优化
原有技术架构无法完全支持现有业务量需求在互联网行业其实是一个由来已久的普遍性问题。
就像搭建一个房子,前期因为居住人数不够多,所以建筑师考虑的楼层只有三四层,放在技术架构层面来看,便是初期架构设计阶段主要以业务为导向,用户的要求也相对较为容易满足。很多时候难免出现赶鸭子上架的模式。但随着业务不断发展,楼层越来越高,住户的要求也日益增长。以前的房屋架构,因为前期设计无法预估到后期发展而显得力不从心。
阿里巴巴的中台战略、蚂蚁金服的微服务架构、字节跳动的移动端基础建设、腾讯的游戏服务架构等都经历过这一阶段。
通过对架构持续优化,快递 100 收件端团队实现了最大限度的性能升级。
统一技术栈
另一方面,技术栈的碎片化构成了快递 100 收件端团队亟待破解的另一大难题,技术栈的不统一加大了管理的复杂度。再次用建造房屋作比,就好似每位工匠使用的工艺与工具各不相同,这不仅导致资源配置的杂乱无章,更让整体房屋结构的稳固性受到严重威胁。
在技术层面,解决这一困境的专业术语被称为 " 统一技术栈 "。这相当于要求所有工匠采用统一的砌砖技艺,确保每一块砖石都能无缝对接,共同构筑起稳固的建筑。本次专项中,实现了微服务中框架的统一、中间件技术的统一、跨服务调用的统一。
这种统一化策略的核心价值在于简化框架、削减中间件的依赖,以及促进技术栈的现代化。当每一环节的专家都能专注并精通于特定领域时,其专业水平和工作效率自然得以显著提升。如此一来,不仅减少了因技术差异带来的沟通成本,还极大地增强了系统的整体稳定性和团队的协同效能,为快递 100 服务的持续提升铺平了道路。
7x24 小时无感发布
在互联网行业,绝大多数公司都会面临系统发布新版本时 , 用户感受到 1-2 分钟的明显卡顿的问题。这一共性问题也同样影响了快递 100 收件端系统的使用体验 , 从而造成业务部分中断。
为了解决这一问题 , 快递 100 团队专门针对无感发布进行了深入的研究和攻关。 通过建立完善的自动化构建 , 大大缩短了发布周期 , 提高了发布效率。同时,还引入了接口级灰度发布的能力 , 将新版本功能逐步推广到部分用户,在确保稳定性的前提下,加快新功能的迭代。
这样一来 , 即使在系统进行 7x24 小时不间断的发布过程中 , 用户也无法感知到任何变化 , 整个过程完全无感,用户享受的服务依旧流畅如初。不仅如此 , 团队还针对关键业务接口实现了灰度发布 , 即使在发布过程中出现问题 , 也可以快速回滚 , 确保业务的持续稳定运行。
种种举措不仅提高了发布效率 , 降低了人为错误的风险 , 同时也大幅提升了用户的使用体验 , 真正实现了 7x24 小时的持续交付。
此外,在项目推进过程中,专项组积极定位打印问题,分析订单用户属性,制定运营策略,同时,针对业务高峰期出现的大量订单同时涌入的问题,专项组通过种种运营策略,使得接口性能提升 20%,数据库 I0 压力显著下降。
03 毫秒级响应的背后能力
经过 102 个日夜的不懈努力,快递 100 的技术团队不仅实现了收件端系统的华丽转身,更让日常 " 少于 30 毫秒的响应 " 成为可能,为快递小哥们提供了更加稳定、高效、便捷的服务体验。通过统一技术栈、引入动态线程池、实现接口级灰度等一系列技术革新,快递 100 成功将系统稳定性提升到了新的高度,展现了快递 100 团队以客户为中心的价值观和卓越的技术实力。
在行业内,高并发场景下系统不稳定的问题是众多企业共同面临的挑战,快递 100 却选择不忽视任何一个小问题,深思熟虑,寻找持久有效的解决方案。
14 年前,一个偶然的客户调研 " 意外地 " 催生了快递 100,也萌芽了质朴初心:一是开放之心,绝不闭门造车,永远以客户为导向,主动走到客户中去,倾听客户有声的诉求和无声的渴求;二是利他之心,把客户的麻烦当成自己的麻烦,感同身受、如救头燃,不是将商业利益放在首位,而将帮助客户解决痛点放在优先位;三是破局之心,敢于 Think out of the Box,敢于跳出现有格局,敢于突破自我设限,开创新蓝海。
每一次勇敢的尝试与不懈的创新,都是快递 100 成长历程中不可或缺的宝贵财富。展望未来,快递 100 将继续秉持初心,以更加坚定的步伐,书写快递物流行业的新篇章。
登录后才可以发布评论哦
打开小程序可以发布评论哦