作者:赵世振、刘松伟、朱坪"
从了解阿里云 SAE 到使用 SAE 进行应用架构升级共经历 3 周,这 3 周我们系统能承载的 QPS 从 5000 增强到 10 万,提升 20 倍,轻松应对了春晚大促流量洪波。并且,SAE 还帮助我们降低了 20% 的使用成本,研发效率提升 40% ,应用上线周期缩短 40% 。
———修正集团副总裁,修程
修正集团于 1995 年 5 月由董事长修涞贵先生创立,是集中成药、化学制药、生物制药的科研生产营销、药品连锁经营、中药材标准栽培于一体的大型现代化民营制药企业。旗下业务涵盖医药、健康等多个核心板块,建百年修正,创民族品牌,修正集团连续 12 年蝉联医药制造业百强前十,2023 年度世界品牌 500 强、民营企业 500 强。
项目背景
修正商城,是修正集团电商事业部旗下的 B2C 医药健康类交易平台,以修正药品、健康类食品及保健品为主要交易商品,为用户提供安全放心的网上购物环境。
在 2024 年春节前夕,修正电商事业部面临了前所未有的技术挑战,修正将参与春晚的全民健康好礼派发的活动,且在央视及各大平台进行广告投放,预计流量激增至 16 亿,系统需要承载保底 5 万 QPS,目标 10 万 QPS。 修正技术团队迫切需要升级 APP 架构以应对即将到来的超高并发场景。这一挑战不仅是对技术的考验,更是对修正品牌实力的一次展示。为了应对这次巨大的技术挑战,修正技术团队选择与阿里云云原生团队合作,进行 APP 架构的升级。
流量激增对原有架构的挑战
修正商城原有架构图
尽管修正商城的技术架构在日常运营和小规模节假日期间表现出色,确保了服务的流畅性和稳定性,但在应对春节晚会等大规模流量高峰时,仍然面临明显的性能和扩展性挑战。具体来说,技术挑战主要包括以下几点:
单体应用架构的挑战
-
扩展性挑战:
- 原有商城系统是基于单体架构开发的 PHP 应用,所有功能模块全部耦合在一个代码库和一个部署单元中,且原有云主机暂未提供灵活地按需扩展或者缩减资源能力。
- 基于服务器的部署方式限制了系统的扩展性,紧耦合的单体架构,流量洪峰时,仅增加服务器数量系统性能提升有限,非常耗时也保证不了系统 SLA。
-
可靠性挑战:
- 单点故障风险高,系统中单点故障的隐患犹如脆弱的链环,哪怕是最细微的差池,也可能引发连锁反应,致使整个服务体系陷入瘫痪。
- 当前系统设计上缺省了关键的冗余防护与高可用性策略,这意味着在面临大规模流量洪峰的紧要关头,系统的抗压能力显得尤为脆弱。任何突发故障,都可能导致服务中断,并伴以较长的恢复周期,这对于追求无缝体验与持续运营的目标而言,无疑是一大隐忧。
系统可观测性不足
-
应用日志存储及实时分析挑战:面对高达十万次每秒的查询需求,随之而来的海量业务日志对现有的服务器存储能力及日志管理方式提出了严峻挑战。传统的磁盘存储方案与手动日志审查手段,在如此庞大的数据量面前显得捉襟见肘,难以胜任快速定位与诊断系统问题的重任,亟需一场革新以适配更高的效率需求。
-
缺乏系统可观测性:
- 缺乏完善的监控与报警体系,系统实际运行状态难以实时掌握。
- 无法对流量、性能、错误等关键指标进行有效监测与分析,无法提前预警,存在极大的运维风险。
QPS目标的巨大差距
- 现有 5000 QPS(查询每秒请求数)能力,与春节期间需要承载的预计保底 5 万 QPS、目标 10 万 QPS 仍有较大差距,需要迅速提升约 20 倍的处理能力。
所以修正技术团队面临着重构架构的紧迫任务,不仅要解决现有的可靠性和扩展性问题,还要优化系统的监控、日志处理能力,以保证在春节高峰期间提供良好的用户体验,维护品牌形象。
阿里云解决方案
架构升级图
为了应对修正商城在 2024 年春节期间面临的高流量冲击,阿里云提供了全面的架构升级方案,具体解决方案如下:
1. 基础架构迁移与应用拆分
-
Serverless 应用引擎(SAE)应用全托管:
- 针对原有的云主机方案存在的不足,采用阿里云的 Serverless 应用引擎(SAE)进行全面替代。SAE 无需管理底层服务器,可以根据实际流量需求自动调整资源分配,确保在高并发场景下系统的平稳运行。相比云上虚拟机部署方式,SAE 能够快速响应流量波动,提高资源利用效率,极大简化了运维复杂性。
- 通过 SAE 的多实例部署,增强了应用的冗余能力,提高了系统的可靠性。
-
镜像管理与拉取:
- SAE 支持通过阿里云 ACREE(企业级容器镜像库)拉取应用镜像,简化了部署流程,保证了应用的快速迭代和更新。
- 开通镜像加速服务,优化弹性效率。
2. 系统可观测性与监控
-
SAE 集成系统监控:
- 提供基础的系统监控能力,实时监测应用的健康状态和性能指标。
-
SAE 统一日志管理:
- 使用 SLS(日志服务) 进行日志的统一采集和存储,实现集中管理和实时分析,提升问题定位和解决效率。
业务价值
阿里云提供的解决方案,尤其是 Serverless 应用引擎(SAE)的应用,为修正商城带来了显著的价值。通过架构升级和优化,解决了现有系统中的主要瓶颈,满足了高并发场景的需求,确保了系统的高可用性和稳定性。以下是具体的价值体现:
- 通过 SAE 弹性策略解决方案,可以从容应对固定周期的业务洪峰,一键启停业务运行环境,极大地提升了资源利用率,比云主机方案节省 20% 以上的硬件成本。 同时省去了原来预估资源、临时部署应用的操作,极大减轻了运维团队的工作量,整体效率提升 40%。
- 通过 SAE 自带的监控解决方案以及与 ARMS 监控的无缝集成,帮助客户快速、精准定位问题,整体 Bug 处理速度提升 30%。
- SAE 极致扩缩容的背后是极致的资源利用率,帮助客户整体资源利用率提升近 50%。
- 通过 SAE 平台对微服务生命周期的管理,上线周期缩短达 40% ,满足业务的快速迭代要求。
修正集团与阿里云合作展望
在修正电商事业部的全面技术革新之旅中,修正电商以阿里云 Serverless 应用引擎(SAE)为核心,成功实现了系统架构的飞跃式升级,这不仅标志着修正自研系统在扩展性、可靠性和灵活性上的重大突破,也开启了运维管理与资源利用效率的新篇章。通过这次升级,修正电商事业部大幅削减了运营成本,同时显著增强了用户的交互体验,巩固了修正品牌在健康市场中的领先地位,并在节假日期间高流量的考验下,依旧确保了交易流程的流畅与高效,稳固了用户对修正电商的信赖。
此番变革深刻启示了云计算技术对于修正集团战略发展的重要性。修正集团视阿里云不仅是技术供应商,更是携手共进的创新伙伴。展望未来,修正集团将深化与阿里云的合作广度与深度,充分利用云计算的弹性伸缩、高效成本控制等优势,为修正自研系统的持续创新与智能化演进注入动力,旨在开创个性化、智能化健康管理服务的新纪元,为消费者带来覆盖更全面、体验更便捷的健康解决方案。
不仅如此,修正电商事业部将以此次成功转型为契机,积极探索云计算在医药健康产业的广泛应用与深度融合,力求在数字化转型的宽广大道上,不断突破边界,引领行业新风向,实现技术与健康的完美交汇,共绘医药健康行业的未来蓝图。