AirBnb架构简史

2007 年,布莱恩·切斯基 (Brian Chesky) 和乔·加比亚 (Joe Gabbia) 搬到了旧金山。他们一边想为自己的创业想法筹集资金,一边又需要支付房租。

碰巧的是,当时城里正要举行一个设计会议,这意味着很多设计师都会寻找住处。他们想出了在客厅里放一个充气床垫,把它变成一个提供住宿和早餐的旅馆的主意。

2008 年,Nathan Blecharczyk 加入 Brian 和 Joe 的公司,担任首席技术官和联合创始人,他们创办了名为 AirBed and Breakfast 的企业。

这就是 Airbnb 的诞生。

如今,Airbnb 已覆盖 200 多个国家,400 万房东在全球范围内接待了超过 15 亿客人。

随着 Airbnb 的突飞猛进,其软件架构也不断发展以跟上时代的变化。

在这篇文章中,我们将回顾 Airbnb 架构多年来的演变、他们一路走来所获得的经验教训以及他们为支持这一愿景而开发的工具。

初始版本

与大多数初创公司一样,Airbnb 的第一个 Web 应用程序版本是一个单体应用程序。它使用 Ruby-on-Rails 构建,内部称为monorail

在 Airbnb 看来,Monolith 是一个负责客户端和服务器端功能的单层单元。

这在实践中意味着什么?

这意味着模型、视图和控制器层被组合在一个单一的存储库中。

下图显示了这种方法。

这种整体式方法有几个优点:

  • 单体应用很容易上手,这也是 Airbnb 最初的需要
  • 它们有利于敏捷开发
  • 复杂性是可控的

随着 Airbnb 工程团队的快速发展,问题也随之而来。Airbnb 的规模逐年翻倍,这意味着越来越多的开发人员在单体应用程序中添加新代码,并更改现有代码。

随着时间的推移,代码库开始变得更加紧密,数据所有权变得不明确。例如,很难确定哪些表属于哪个应用程序功能。任何开发人员都可以对应用程序的任何部分进行更改,跟踪和协调更改变得困难。

这种情况导致了多个问题,例如:

  • 在任何时候,都有数百名工程师在单轨列车上工作,因此部署变得缓慢而繁琐。
  • 由于 Airbnb 遵循民主部署的理念(每个工程师负责测试和部署他们的更改以投入生产),这导致其变更相互冲突,陷入混乱。
  • 工程效率下降,开发人员的挫败感日益增加。

为了缓解这些痛点,Airbnb 开始了从单体架构向面向服务架构(SOA)的迁移之旅。

Airbnb 的 SOA

Airbnb 如何看待面向服务架构(SOA)?

对于他们来说,SOA 是一个松散耦合的服务网络,其中客户端向某种网关发出请求,网关将这些请求路由到多个服务和数据库。

采用 SOA 使 Airbnb 能够单独构建和部署服务。此外,这些服务可以独立扩展,所有权也变得更加明确。

然而,构建服务是一回事。以规范的方式设计这些服务也极其重要。

Airbnb 决定采用一些关键原则来以规范的方式设计这些服务:

  • 服务应拥有对其数据的读取和写入。这与每个服务一个数据库的模式非常相似,其中特定的数据库应由一个且仅一个服务拥有,从而更容易维护数据一致性。
  • 每项服务都应解决一个特定的问题。Airbnb 希望确保单体不会分解成另一个巨型服务,随着时间的推移,该巨型服务又会变成另一个单体。此外,他们还希望避免走上只擅长一件事的传统细粒度微服务之路。相反,Airbnb 转向构建专注于特定业务功能的服务。可以将其视为高内聚设计。
  • 服务应避免功能重复。通过共享库和共享服务可以共享部分基础设施或代码,从而更易于维护。
  • 数据变更应通过标准事件进行。例如,如果预订服务创建了新行,则可用性服务应通过事件了解此预订,以便将房屋的可用性标记为繁忙。
  • 每项服务都必须像任务关键型服务一样构建。这意味着服务应该具有适当的警报机制、内置可观察性和基础设施最佳实践。

在 Airbnb 看来,这些原则极其重要,它们有助于创建一条所有工程师都可以遵循的逻辑路径,以建立对服务架构的共同理解。

职场攻略与副业指南,成就你的IT人生。快扫描下面二维码关注吧!

ba1e8177db424136a3b666cf83ea7eef.png

Airbnb 的迁移之旅

秉承着上述原则和目标,Airbnb开始了从单轨模式向全新服务型模式的迁移之旅。

这是一个漫长的迁移过程,一路上经历了多次迭代。

版本 1

在这个版本中,每个请求都通过单轨进行。

单轨主要负责表示视图、业务逻辑以及数据访问。

你可以将其视为 Airbnb 架构的初始状态。

版本 2

下一个版本是单轨与面向服务的架构共存的混合版本。

主要区别在于单轨仅处理路由和视图层。它的工作是将传入的 API 流量发送到负责业务逻辑、数据模型和访问的新服务网络。

我们在这里谈论的是什么样的服务?

Airbnb 将其服务分为四种不同类型,如下图所示。

以下是各类服务的详细信息:

  • 数据服务——这是最底层,是所有数据实体读写操作的入口点。数据服务不能依赖于任何其他服务,因为它只访问数据存储。
  • 派生数据服务 — 派生服务位于数据服务之上一层。这些服务可以读取数据服务,也可以应用一些基本的业务逻辑。
  • 中间层——用于容纳不适合数据服务级别或派生数据服务级别的大量业务逻辑。
  • 演示服务 — 结构最顶层是演示服务。它们的工作是汇总来自所有其他服务的数据。此外,演示服务还会在将数据返回给客户端之前应用一些前端特定的业务逻辑。

有了这些服务定义,Airbnb 开始构建数据服务层。

例如,他们从家庭数据服务开始,这是 Airbnb 业务的基础层。当​​前的单轨设置使用 Rails 中的 Active Record 数据访问库从表中访问数据。

他们在 Active Record 级别拦截传入的请求,并且不路由到数据库,而是将这些请求发送到新的家庭数据服务。然后,家庭数据服务负责路由到数据存储。

下图显示了这种方法。

在创建核心数据服务之后,Airbnb 还将核心业务逻辑迁移到了 SOA 方法。

例如,迁移定价派生数据服务等服务,该服务需要来自家庭数据服务以及其他存储(如离线价格和趋势)的有关房屋的一些信息。

下一步涉及迁移演示服务,例如依赖于派生数据服务和核心数据服务的定价信息和房屋信息的结帐演示服务。

所有这些变化都是版本 2 的一部分,其中单轨列车和新服务在同一个请求周期内共存。

版本 3

在这个版本的迁徙之旅中,单轨列车被彻底淘汰了。

客户端向 API 网关发出请求,该网关充当负责中间件和路由的服务层。网关填充请求上下文并将请求路由到 SOA 网络,其中各种服务负责表示逻辑和数据访问逻辑。

Web 客户端的处理方式略有不同。有一个专门的服务来处理 Web 请求。

为什么需要它?

此服务通过调用 API 网关并以所需格式填充收到的响应,将 HTML 返回到 Web 客户端。API 网关负责所有中间件功能并通过 SOA 网络传播请求。

下图试图展示这种情况:

迁移读取和写入

到目前为止,您可能已经意识到,从单一架构转变为面向服务的架构并不是一朝一夕的过程。

对于 Airbnb 来说,中间阶段花费了大量时间,其中必须将单轨列车和新服务作为一等公民来支持。

请求可以通过单轨或服务进行。这意味着,确保两条路线的功能不会中断并且响应相同是一项关键要求。

为了支持这一点,Airbnb 建立了读取和写入的比较框架。

阅读

这些比较框架的首次使用是在读取操作中,因为读取是幂等的。您可以发出多个读取请求并获得相同的响应。

这个想法是发出双重读取,并将通过单轨的读取路径 A 的响应与通过新服务的读取路径 B 的响应进行比较。然后将捕获的响应作为标准事件发出,这些事件被使用并发送到离线比较框架。

比较框架被置于管理工具后面,这样无需更改代码和部署即可控制流量。响应调整完成后,Airbnb 工程师可以通过服务路径缓慢增加流量,并监控比较结果是否存在差异。

一旦比较看起来清楚,所有读取请求都会移动到新服务。

写入

对于写入,必须采取不同的做法,因为无法对同一个数据库进行双重写入。因此,我们利用了影子数据库。

假设单轨列车正在调用访问生产数据库的演示服务。这是写入路径 A。

现在,引入了中间层服务来减轻演示服务的一些验证负担。最初,此中间层服务将写入影子数据库,而不是主生产数据库。

此时,可以轻松地向生产数据库和影子数据库发出强一致性读取请求并比较结果。

一旦比较清楚,我们就可以通过新服务将写入内容移至生产数据库。

SOA 的优点和缺点

随着 Airbnb 从单轨铁路向基于 SOA 的架构的迁移,一些优点和缺点开始变得明显。

一些优点如下:

  • 系统变得更加可靠和高可用。即使一个服务出现故障,面向服务架构的其他部分仍可正常运行。
  • 服务现在可以单独扩展,允许根据系统的实际需求对资源分配进行微调。
  • 由于将产品的不同部分划分为不同的服务,因此提高了业务敏捷性。每个团队可以并行迭代。

然而,也存在一些缺点:

  • 工程师可能需要更多时间才能在面向服务架构中发布一项功能,因为他们需要首先熟悉各种服务。此外,任何变更都可能涉及多项服务
  • 即使服务是松散耦合的,某些逻辑模式也必须在不同的服务之间重复。
  • 依赖关系图复杂,尤其是在缺乏 API 治理的情况下。这也可能导致循环依赖,并使工程师难以调试错误。

支持 SOA 的工具和技术

正如我们从上一节看到的,迁移到 SOA 为 Airbnb 工程团队带来了多重挑战。

例如,单个请求现在会分散到多个服务,从而增加失败的几率。此外,将数据模型分离到多个数据库中有利于服务级别的一致性,但这会使事务性更难以实施。

随着时间的推移,服务编排也变得越来越复杂。由于有数百名工程师在构建服务,Airbnb 需要更多的 EC2 实例。最终,这促使其转向使用 Kubernetes。

为了让工程团队轻松构建服务,Airbnb 的基础设施团队在此过程中创建了许多构建模块。

API 框架

Airbnb 创建了一个使用 Thrift 语言构建的内部 API 框架。

所有 Airbnb 服务均使用该框架来定义可以相互通信的清晰 API。

例如,假设服务 A 想要与服务 B 通信。服务 B 工程师只需使用简单的 Thrift 语言定义端点,框架就会自动生成端点逻辑来处理常见内容,例如模式验证、可观察性指标等。

此外,它还创建一个多线程 RPC 客户端,服务 A 可以使用它来与服务 B 通信。该客户端处理各种功能,例如重试逻辑、错误传播和传输。

这有什么好处呢?

工程师可以专注于处理核心业务逻辑,而不必花时间担心服务间通信的细节。

为了提高开发人员的工作效率,Airbnb 基础设施团队还开发了 API Explorer,工程师可以在其中浏览不同的服务,确定要调用哪些端点,甚至使用 API 游乐场来了解如何调用这些端点。

使用 Spinnaker 进行自动 Canary 分析

Airbnb 还利用了开源持续交付平台 Spinnaker。

Spinnaker 用于跨各种云平台进行应用程序管理和部署。它支持所有主流平台,例如 AWS、Azure、Kubernetes 等,因此可以非常轻松地启动新的部署环境。

您可以在 Spinnaker 中创建管道来表示特定的交付过程,该过程从创建构建工件开始,一直到在环境中部署该工件。

借助 Spinnaker,Airbnb 能够轻松设置执行自动金丝雀分析的环境。

基本上,他们将新旧快照都部署到两个临时环境中,然后将一小部分流量路由到它们两个。

根据流量分析和错误率,为金丝雀环境生成一个总体分数,帮助决定是否失败或将金丝雀提升到部署过程的下一阶段。

Powergrid

Airbnb 还建立了一个名为 Powergrid 的内部库,使并行运行任务变得容易。

通过 Powergrid,他们能够将代码执行组织为有向无环图 (DAG)。

这个 DAG 的每个节点都是一个函数或任务。利用这个,Airbnb 工程师可以将每个服务端点建模为一个数据流,其中请求为输入,响应为输出。

由于 Powergrid 支持多线程和并发,因此可以用来并行运行任务。

下图显示了 Powergrid 的概念。

例如,假设主人想给客人发送特别优惠。然而,在发送之前,需要进行多次检查和验证。

借助 Powergrid,各个服务可以并行执行这些验证。汇总响应后,即可向客户发送特别优惠。

简化服务依赖关系

一旦 Airbnb 开始走上 SOA 之路,就再也没有回头路了。

然而,最初缺乏服务治理和依赖管理,导致服务交互图复杂。在面向服务的方法中,调用图变得极其复杂总是一种危险的情况。

  • 任何新的改变都会导致开发速度减慢。
  • 此外,维护也变得困难。

为了处理这种情况,Airbnb 决定使用服务块的概念来简化服务依赖关系。

基本上,您可以将每个块视为与特定业务功能相关的服务的集合。

例如,列表块封装了与核心列表属性相关的数据和业务逻辑。同样,您还可以拥有其他块,例如用户块和可用性块。

然后,Block 可以向上游客户端公开一个干净整洁的外观,并具有一致的读写端点。在底层,外观会根据需要协调数据和业务逻辑服务之间的协调。此外,还会实施严格的检查,以防止直接调用块内的任何内部服务。

这种方法大大降低了面向服务调用图的复杂性。

结论

总而言之,Airbnb 在从单轨迁移到 SOA 的整个过程中得到了几个重要的教训。

以下是一些需要注意的重要事项:

  • 尽早投资公共基础设施
  • 优先简化服务依赖关系
  • 进行必要的文化变革以实现面向服务的方法
  • SOA 不是一个固定的目的地,而是一个不断改进和完善的旅程。

职场攻略与副业指南,成就你的IT人生。快扫描下面二维码关注吧!

ba1e8177db424136a3b666cf83ea7eef.png

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/654079.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

海外仓系统要多少钱?最贵的未必是最好的,性价比高的才是

海外仓系统可以说已经是现在海外仓管理不可或缺的重要工具,然而,很多海外仓企业在选择海外仓系统时最头疼的问题就是不知道到底多少钱才合适。 确实,现在的海外仓系统市场价格体系非常多,几万几十万各种定价都有,让人…

linux父进程fork出子进程后,子进程为何首先需要close文件描述符。

在linux c/c编程时,父进程fork出子进程后,子进程经常第一件事就是close掉所有的文件描述符;为何需要这样做,本文用一个例子进行简单说明。 考虑到一种情况,父进程创建了tcp服务端套接字,并且listen&#x…

redis核心面试题二(实战优化)

文章目录 10. redis配置mysql实战优化[重要]11. redis之缓存击穿、缓存穿透、缓存雪崩12. redis实现分布式session 10. redis配置mysql实战优化[重要] // 最初实现OverrideTransactionalpublic Product createProduct(Product product) {productRepo.saveAndFlush(product);je…

ProxySQL路由策略实现读写分离

目的:配置proxysql路由策略后将不同用户的不同请求路由到不同的节点,实现读写分离 前提条件: 配置表mysql_replication_hostgroups,10为写组,20为读组 mysql_users表中已添加用户writer用户加入10写组,rea…

linux开发之设备树基本语法二

设备树特殊节点,对节点定义别名,chosen节点用来uboot给内核传参 上面的mmc0就是sdmmc0节点的别名 device_type属性 只对cpu节点和memory节点进行描述 自定义属性 这部分自定义,比如定义管脚标号,初始数值等 为什么我们可以在设备树上自己定义属性呢?设备树文件描述的是硬…

AI手语研究数据集;视频转视频翻译和风格化功能如黏土动画;AI检测猫咪行为;开放源码的AI驱动搜索引擎Perplexica

✨ 1: Prompt2Sign 多语言手语数据集,便捷高效用于手语研究。 Prompt2Sign 是一个全面的多语言手语数据集,旨在通过工具自动获取和处理网络上的手语视频。该数据集具有高效、轻量的特点,旨在减少先前手语数据集的不足之处。该数据集目前包含…

Python---Matplotlib(2万字总结)【从入门到掌握】

数据可视化 在完成了对数据的透视之后,可以将数据透视的结果通过可视化的方式呈现出来,简单的说,就是将数据变成漂亮的图表,因为人类对颜色和形状会更加敏感,然后再进一步解读数据背后隐藏的价值。在之前的文章中已经…

gitlab push 代码,密码正确,仍然提示HTTP Basic: Access denied. The provided password

HTTP Basic: Access denied. The provided password or token is incorrect or your account has 2FA enabled and you must use a personal access token instead of a password gitlab 登录账户密码确认正确,登录获取代码仍然提示以上问题,解决方案 …

10、QT—SQLite使用小记1

开发平台:Win10 64位 开发环境:Qt Creator 13.0.0 构建环境:Qt 5.15.2 MSVC2019 64位 构建工具:qmake 在上一篇文章中笔者介绍了sqlite的使用,并提供了一个封装好的文件,这篇文章就针对封装好的文件进行测试…

在table中获取每一行scope的值

目的 当前有一份如下数据需要展示在表格中&#xff0c;表格的页面元素套了一个折叠面板&#xff0c;需要循环page_elements中的数据展示出来 错误实践 将template放在了折叠面板中&#xff0c;获取到的scope是空数组 <el-table-column label"页面元素" show-o…

3D Slicer:从入门到精通——数据模块之DICOM

DICOM 文章目录 DICOM概述DICOM简介Slicer DICOM数据库DICOM插件 如何操作创建DICOM数据库将DICOM文件读入场景DICOM导入DICOM加载 从DICOM数据库中删除数据将数据从场景导出到DICOM数据库将数据从场景导出到DICOM文件DICOM网络传输DICOMweb网络传输 查看DICOM元数据 面板及其用…

初识STM32单片机-TIM定时器

初识STM32单片机-TIM定时器 一、定时器概述二、定时器类型2.1 基本定时器(TIM6和TIM7)2.2 通用定时器(TIM2、TIM3、TIM4和TIM5)2.3 高级定时器(TIM1和TIM8) 三、定时中断基本结构和时基单元工作时序3.1 定时器基本结构3.2 预分频器时序3.3 计数器时序3.3.1 计数器有无预装时序(…

广告界的奥斯卡:揭秘成功广告策划的核心要素

在这个品牌林立、竞争激烈的市场大潮中&#xff0c;想要让自己的品牌声音被听见&#xff0c;一个成功的广告策划无疑是你的超级扩音器。 一个成功的广告策划一般来说需要以下十大要素&#xff1a; 1. 明确的目标和受众定位&#xff1a;你的指南针 首先&#xff0c;咱们得有个…

aws eks节点的初始化引导和鉴权逻辑

kubernetes集群的kubelet的启动引导eks集群的kubelet启动引导 参考资料 https://juejin.cn/post/7016472622246395934eks安全最佳实践&#xff0c;https://aws.github.io/aws-eks-best-practices/security/docs/iam/ kubernetes集群的kubelet的启动引导 按照官方文档和相关…

灵动微SPI LCD彩屏参考方案

LCD显示能够提供均匀的、流畅的、色彩鲜艳的动态或静态的图像&#xff0c;尤其在家电应用、智能家居应用、消费电子等产品中&#xff0c;受到了广大消费者的青睐&#xff0c;同时也受到了市场的广泛关注&#xff0c;为此&#xff0c;官方代理英尚微介绍搭载MM32系列MCU的SPI LC…

【SpringBoot】单元测试实战演示及心得分享

目录 1.指定测试标准 2.设计测试用例 3.测试集示例 4.跑测试集 1.指定测试标准 单元测试会用到mock和junit的内容&#xff0c;作者前文有详解&#xff0c;可移步&#xff1a; Spring Boot单元测试-CSDN博客 mockito的详细使用-CSDN博客 1.1.测哪一层&#xff1f; 以当…

solidworks 3D草图案例2-方块异形切

单位mm 单位mm 长方体 底面是48mm*48mm&#xff0c;高为60mm 3D草图 点击线&#xff0c;根据三视图&#xff0c;绘制角度线&#xff0c; 由于三点确定一个面&#xff0c;因此确定三点就可以了 基准面 点击参考几何体-基准面&#xff0c;依次点击3个点 曲面切除 完成后点击插…

海外仓ERP系统:赋能海外仓,实现标准化管理

随着业务规模的不断发展和业务类型的复杂度逐渐提升&#xff0c;传统的海外仓管理模式已经很难适应现在的情况了。对海外仓企业来说&#xff0c;一套合适的海外仓管理erp系统可以起到很大的辅助作用。 不过很多小型海外仓企业会纠结于是同时选择企业erp系统和海外仓管理系统&a…

重庆耶非凡科技有限公司的选品师项目靠谱吗?

在跨境电商和零售市场日益繁荣的今天&#xff0c;选品师的角色愈发凸显出其重要性。重庆耶非凡科技有限公司作为一家致力于多元化服务的科技公司&#xff0c;其选品师项目备受关注。那么&#xff0c;重庆耶非凡科技有限公司的选品师项目靠谱吗?接下来&#xff0c;我们将从多个…

网上3d全景虚拟交互展馆沉浸式体验让客户和使用者都满意

在数字化浪潮席卷而来的今天&#xff0c;3D场景网站已成为众多行业展现创意与实力的新舞台。然而&#xff0c;传统的3D建模软件往往因其复杂性和高门槛&#xff0c;让许多渴望创建逼真3D场景的用户望而却步。 幸运的是&#xff0c;华锐视点推出了搭建3D场景网站的编辑器——一款…