Hadoop-YARN-Tutorial

Hadoop-YARN-Tutorial

在这里插入图片描述

1 What is YARN?

Yarn is the acronym for yet another resource negotiator.
Yarn是yet another resource negotiator的缩写。

Yarn is a resource manager created by separating the processing engine and the management function of mapreduce.
Yarn是通过分离mapreduce处理引擎和管理功能创建的资源管理器。

在这里插入图片描述

Monitors and manages workloads maintains a multi-tenant environment,manages the high availability features of hadoop and implements security controls.

监控和管理工作负载,维护多租户环境,管理hadoop的高可用性特性,并实现安全控制。


2.Need For YARN

在2012年之前,用户可以使用Java、python和ruby等脚本语言编写mapreduce程序,也可以使用pig(一种用于转换数据的语言)
在这里插入图片描述

无论使用何种语言,其实现都依赖于mapreduce处理模型。


在2012年5月hadoop 2.0版本发布期间,引入了yarn.。

不再局限于使用mapreduce框架,因为yarn除了支持mapreduce之外,还支持多种处理模型,比如spark。

在这里插入图片描述

在这里插入图片描述
Other features of yarn include significant performance improvement and a flexible execution engine
Yarn的其他特性包括显著的性能提升和灵活的执行引擎.


3.YARN-Use Case

雅虎(YAHOO!)是第一个拥抱hadoop的公司,并成为hadoop生态系统的潮流引领者.

In late 2012,yahoo struggled to handle iterative and stream processing of data on the hadoop infrastructure due to mapreduce limitations

2012年底,由于mapreduce的限制,雅虎在hadoop基础设施上处理迭代和流处理数据时遇到了困难。

Both iterative and stream processing were important to yahoo in facilitating its move from batch computing to continuous computing
迭代处理和流处理对于雅虎从批处理转向连续计算非常重要.

在这里插入图片描述

在 2013 年第一季度实施 yarn 之后,雅虎在 spark 上安装了 3 万多个生产节点,用于迭代处理。

  • 用于迭代处理的 spark

  • 用于流处理的 storm

  • 用于批处理的 hadoop

Allow it to handle more than 100 billion events such as clicks, impressions, email content ,metadata and so on per day.

这使其每天能够处理超过 1000 亿个事件,如点击、印象、电子邮件内容、元数据等。

This was possible only after yarn was introduced and multiple processing frameworks were implemented.

这只有在引入yarn并实现多个处理框架后才可能实现


4.YARN-Advantages

the single cluster approach provides a number of advantages
单集群方法具有以下优势:
在这里插入图片描述

  • 集群利用率更高,一个框架未使用的资源可由另一个框架使用

  • 降低运营成本,因为只需管理一个集群即可完成所有工作

  • 减少数据移动,因为无需在不同计算机集群上运行的 hadoop 纱线和系统之间移动数据


5.YARN Infrastructure

The yarn infrastructure is responsible providing computational resources such as cpu or memory needed for application executions.
Yarn基础设施负责提供计算资源,如执行应用程序所需的 CPU 或内存。

Yarn的基础设施和hdfs是完全独立的。Yarn infrastructure and hdfs are completely independent.

前者为运行应用程序提供资源,而后者提供存储。The former provides resources for running an application while the latter provides storage.

在这里插入图片描述

Mapreduce框架只是运行在yarn上的众多框架之一。The mapreduce framework is only one of the many possible frameworks that run on yarn.

The fundamental idea of mapreduce version 2 is to split the two major functionalities of resource management and job scheduling and monitoring into separate demons.

✔✔✔✔✔✔
mapreduce版本2的核心思想是将资源管理和作业调度与监控这两个主要功能分开。


6.Three Elements of YARN Architecture

The three important elements of the yarn architecture are Resource Manager ,Application Master ,and Node Manager

在这里插入图片描述

  • Resouce Manager

    • 通常每个集群都有一个资源管理器(rm),即master server主服务器.
      The resource manager or rm which is usually one per cluster is the master server

    • RM资源管理器知道数据节点的位置以及它们有多少资源.
      Resource manager knows the location of the data node and how many resources they have

    • 这一信息被称为机架感知.This information is referred to as rack awareness.

    • rm 运行几项服务,其中最重要的是资源调度程序(resource scheduler),它决定如何分配资源。
      The rm runs several services,the most important of which is the resource scheduler that decides how to assign the resources.

在这里插入图片描述


  • Application Master
    • Application Master是一个特定于框架的进程,负责为单个应用协商资源。
    • 每个Application Master从RM资源管理器请求资源,然后使用NM节点管理器提供的容器。
      Each application master requests resources from the resource manager and then works with the containers provided by node managers.

在这里插入图片描述
在这里插入图片描述


  • Node Manager
    • 一个集群中可以有多个节点管理器,他们是基础设施的工作节点
      the node managers can be many in one cluster,they are the slaves of the infrastructure.

    • 当它启动时,它会向 RM资源管理器 宣布自己的存在,并定期向 rm 发送心跳信息。
      When it starts it announces itself to the rm and periodically sends a heartbeat to the rm.

    • 每一个Node Manager都会向集群提供资源。 Each node manager offers resources to the cluster.

在这里插入图片描述

资源容量resource capacity是指内存容量和虚拟内核的 vcores 数量。

At runtime the resource scheduler decides how to use this capacity.运行时,RM资源调度器将决定如何使用这些资源。


Container is a fraction of the node manager capacity and it is used by the client to run a program.
容器是节点管理器容量的一部分,客户端使用它来运行程序.

在这里插入图片描述

Each NodeManager takes instructions from the ResourceManager, reports and handles containers on a single node.
每个 Node Manager 从 Resource Manager 接收指令,报告并处理单个节点上的容器。

在这里插入图片描述


1.Resouce Manager

  • RM在相互竞争的应用程序之间协调集群中的可用资源,以实现最大的集群利用率。
    The rm mediates the available resources in the cluster among competing applications with the goal of maximum cluster utilization.

在这里插入图片描述

  • RM包括一个名为the YarnScheduler的可插拔调度器,它允许使用不同的策略来管理约束,如容量调度器、公平调度器和服务水平协议。
    It includes a plugable scheduler called the yarn scheduler which allows different policies for managing constraints such as capacity fairness and service level agreements.

  • 资源管理器有两个主要组件——调度程序scheduler 和应用程序管理器applications manager
    the resource manager has two main components——scheduler and applications manager

在这里插入图片描述

  • 调度器负责根据容量线索等共同约束条件为各种运行中的应用程序分配资源
    the scheduler is responsible for allocating resources to various running applications depending on the common constraints of capacities cues and so on

  • scheduler调度器不会监视或跟踪应用程序的状态,也不会在任何应用程序或硬件故障的情况下重新启动任务
    the scheduler does not monitor or track the status of the application also it does not restart the tasks in case of any application or hardware failures

在这里插入图片描述

  • 调度器根据应用程序的资源需求执行其功能
    the scheduler performs its function based on the resource requirements of the applications

  • 它是基于资源容器的抽象概念实现的,资源容器包含内存、CPU、磁盘和网络等元素
    it does so based on the abstract notion of a resource container that incorporates elements such as memory cpu disk and network

  • 调度器有一个策略插件,负责在各种队列和应用程序之间划分集群资源
    the scheduler has a policy plugin which is responsible for partitioning the cluster resources among various queues and applications

在这里插入图片描述

  • 当前的mapreduce调度器,如容量调度器和公平调度器就是该插件的一些例子
    the current mapreduce schedulers such as capacity scheduler and the fair scheduler are some examples of the plugin

  • 容量调度器支持分层提示,以实现更可预测的集群资源共享
    the capacity scheduler supports hierarchical cues to enable a more predictable sharing of cluster resources


  • 应用程序管理器是一个接口,它维护已提交、当前正在运行或已完成的应用程序列表
    the application manager is an interface which maintains a list of applications that have been submitted currently running or completed

在这里插入图片描述

  • Applications Manager应用程序管理器负责接受作业提交,协商第一个执行特定应用程序的容器,并在失败时重启应用程序主容器。
    The applications manager is responsible for accepting job submissions negotiating the first container for executing the application specific application master and restarting the application master container on failure在这里插入图片描述

在这里插入图片描述

  • 资源管理器通过一个名为 ClientService 的接口与客户端通信

  • 客户端可通过 ClientService 提交或终止应用程序,并获取有关调度队列或群集统计数据的信息

在这里插入图片描述

  • administrative requests are served by a separate interface called the admin service through which operators can get updated information about the cluster operation in parallel
    管理请求由名为管理服务的单独接口提供,操作员可通过该接口获取有关群集运行的最新并行信息

  • the resource tracker service receives node heartbeats from the node manager to track new or decommissioned nodes.
    资源跟踪器服务从节点管理器接收节点心跳,以跟踪新节点或退出的节点
    在这里插入图片描述

  • the nm liveliness monitor and nodes list manager keep an updated status of which nodes are healthy so that the scheduler and the resource tracker service can allocate work appropriately

  • 节点存活率监控器和节点列表管理器随时更新节点的健康状态,以便调度器和资源跟踪器服务能适当分配工作.
    在这里插入图片描述

  • the application master service manages application masters on all nodes keeping the scheduler informed.应用程序主控服务管理所有节点上的应用程序主控,并随时通知调度程序。
    在这里插入图片描述

  • the AM liveliness monitor keeps a list of application managers and their last heartbeat times to let the resource manager know what applications are healthy on the cluster
    AM 实时性监控器会保存一份应用程序管理器及其上次心跳时间的列表,以便让资源管理器了解群集上哪些应用程序是健康的

  • any application master that does not send a heartbeat within a certain interval is marked as dead and rescheduled to run on a new container
    任何在一定时间间隔内未发送心跳的应用程序主控都会被标记为死亡,并重新安排在新容器上运行.


2. HA

在这里插入图片描述

在Hadoop 2.4之前,资源管理器(Resource Manager)在YARN集群中是单点故障。
Before Hadoop 2.4, the Resource Manager in a YARN cluster was a single point of failure.

The High Availability (HA) feature introduces redundancy in the form of an active-standby Resource Manager pair to eliminate this single point of failure.
高可用性(HA)特性通过引入主备资源管理器对来消除单点故障,增加了冗余。

资源管理器的高可用性是通过主备架构实现的。
Resource HA is realized through an active-standby architecture.

At any point in time, one Resource Manager (RM) is active, while one or more RMs are in standby mode, ready to take over the active RM’s duties should any unexpected event occur.
在任何时刻,一个资源管理器(RM)是活动的,而一个或多个RM处于待命状态,随时准备接管活动RM的工作,以应对任何意外情况。

切换到活动状态的触发条件可以是管理员通过命令行界面,或者通过集成的故障转移控制器。
The transition to active is triggered either by an administrator via the command-line interface or through the integrated failover controller.

RMs have the option to embed a ZooKeeper-based active-standby elector to determine which RM should be active.
资源管理器可以选择嵌入基于ZooKeeper的主备选举器来决定哪个RM应该是活动的。

当活动资源管理器故障或无响应时,另一个RM会自动选举为活动状态。
When the active RM fails or becomes unresponsive, another RM is automatically elected as the active RM.

It’s important to note that unlike HDFS, there is no need to run a separate ZKFC daemon here, as the embedded active-standby elector in the RM serves as both a failure detector and leader elector.

需要注意的是,与HDFS不同,这里不需要运行单独的ZKFC守护程序,因为嵌入在RM中的主备选举器充当了故障检测器和领导者选举器的角色。


3.Application Master

  • YARN中的应用程序主管是一个特定于框架的库

  • 用于与RM资源管理器协商资源,并与NM节点管理器或管理器一起执行和监视容器及其资源消耗。
    在这里插入图片描述

  • 在应用程序运行时,应用程序管理器负责管理应用程序的生命周期,动态调整资源消耗、执行流程和处理故障,并提供状态和指标。

  • 应用程序主管的架构设计旨在支持特定的框架,可以用任何语言编写,使用可扩展的通信协议与资源管理器和节点管理器交互。

  • 它可以定制以扩展框架功能或运行其他代码。由于应用程序主管不被视为可信的服务,因此不作为可信服务运行。

  • 实际上,每个应用程序都有自己的应用程序主管实例,但可以实现一个应用程序主管来管理一组应用程序,例如,用于Pig或Hive的应用程序主管来管理一组MapReduce作业。


4.NodeManger

当一个容器被分配给一个应用程序时,节点管理器会设置容器的运行环境,这包括根据租约指定的资源限制以及容器所需的数据或可执行文件等依赖关系。

  • 节点管理器监控节点的健康状态,一旦发现硬件或软件问题,会向资源管理器报告,以便调度器能够将资源重新分配到健康的节点,直到问题解决。

  • 节点管理器还为运行在节点上的容器提供多种服务,如日志聚合。

  • 它在每个节点上负责管理容器的整个生命周期、处理容器之间的依赖关系和租约,监控节点和容器的资源使用情况和健康状态,同时负责日志管理,并向资源管理器报告节点和容器的实时状态。

  • YARN容器是一组特定资源的集合,根据应用程序的需要由资源管理器分配到特定的节点上。

  • 应用程序管理器负责将容器分发给节点管理器,在被分配的节点上运行,从而使应用程序可以有效地访问所需资源。


5.YARN Container

YARN 容器是成功分配资源的结果,也就是说,RM 已向应用程序授予租约,允许其使用特定节点上的指定资源。
在这里插入图片描述

启动容器时,ApplicationMaster必须提供容器启动上下文(Container Launch Context, CLC),其中包括以下信息:

  • 环境变量
  • 依赖项,如数据文件或共享对象,在启动前需要的本地资源
  • 安全令牌
  • 创建应用程序想要启动的进程所需的命令

7.How YARN Runs an Application

在这里插入图片描述

1The client submits an application to the ResourceManager

客户端提交应用程序到ResourceManager:

  • 用户通过输入Hadoop的hadoop jar命令将应用程序提交给资源管理器。资源管理器负责维护集群上应用程序的列表和节点管理器上的可用资源。

在这里插入图片描述

2 The ResourceManager allocates a container

ResourceManager分配容器:

  • 资源管理器决定下一个将获得集群资源部分的应用程序,考虑到诸多约束条件,如队列容量、访问控制列表和公平性。

  • ResourceManager接收到应用程序的提交请求后,会分配一个或多个容器给该应用程序。容器是YARN中的基本执行单位,包含了执行应用程序所需的资源。
    在这里插入图片描述

3 The ApplicationMaster contacts the related NodeManager

ApplicationMaster联系相关的NodeManager:

  • 一旦容器被分配给应用程序,Application Master会与被分配容器的NodeManager建立联系。NodeManager是运行在集群节点上的代理,负责管理节点上的容器。
  • 当应用程序被接受后,资源管理器启动应用程序主管(Application Master)。应用程序主管负责管理该特定应用程序的整个生命周期。它向资源管理器发送资源请求以获取运行应用程序任务所需的容器,并协调容器的分配和任务的启动。
    在这里插入图片描述

4 The NodeManager launches the container

NodeManager启动容器:

  • NodeManager收到来自ApplicationMaster的请求后,会启动容器。容器启动过程包括设置容器的环境(包括环境变量、资源等)、拉取所需的依赖资源(如数据文件)、设置安全令牌等。
    在这里插入图片描述
  • 节点管理器负责管理分配给它的容器,包括启动容器中的任务。节点管理器监视容器中的资源使用情况,如内存和CPU份额。它会在必要时终止异常消耗资源的任务。

5 The container executes the ApplicationMaster

容器执行ApplicationMaster:

  • 一旦容器启动并设置好环境,容器内的进程即ApplicationMaster开始执行。ApplicationMaster的主要任务是协调与ResourceManager和NodeManager的通信,并管理应用程序的执行过程,包括任务调度、容器管理、失败处理等。

在这里插入图片描述

  • 应用程序主管在应用程序完成后关闭自身,并释放其使用的容器。资源管理器会检查应用程序主管的健康状态,如果应用程序主管失败,则资源管理器可以重新启动它以确保应用程序的连续运行。

整理不易~多多三连呀😂

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/779563.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

YOLOv8_obb数据集可视化[旋转目标检测实践篇]

先贴代码,周末再补充解析。 这个篇章主要是对标注好的标签进行可视化,虽然比较简单,但是可以从可视化代码中学习到YOLOv8是如何对标签进行解析的。 import cv2 import numpy as np import os import randomdef read_obb_labels(label_file_path):with open(label_file_path,…

ViewController 生命周期

ViewController 生命周期 ViewController 生命周期测试程序:ViewControllerLifeCircle ViewController 生命周期 ViewController 是 iOS 开发中 MVC 框架中的 C,ViewColllecter 是 View(视图)的 Collecter(控制器&…

Vim编辑器与Shell命令脚本

前言:本博客仅作记录学习使用,部分图片出自网络,如有侵犯您的权益,请联系删除 目录 一、Vim文本编辑器 二、编写Shell脚本 三、流程控制语句 四、计划任务服务程序 致谢 一、Vim文本编辑器 “在Linux系统中一切都是文件&am…

TQ15EG开发板教程:MPSOC创建fmcomms8工程

链接:https://pan.baidu.com/s/1jbuYs9alP2SaqnV5fpNgyg 提取码:r00c 本例程需要实现在hdl加no-OS系统中,通过修改fmcomms8/zcu102项目,实现在MPSOC两个fmc口上运行fmcomms8项目。 目录 1 下载文件与切换版本 2 编译fmcomms8项…

【SpringCloud】概述 -- 微服务入门

在Java的整个学习过程中,大家势必会听见一些什么分布式-微服务、高并发、高可用这些专业术语,给人的感觉很高级,有一种高深莫测的感觉。可以看一下这篇博客对这些技术架构的演变有一个初步的认识: 服务端⾼并发分布式结构演进之路-CSDN博客文…

Java开源ERP系统Axelor汉化方法初探

Axelor简介 汉化过程介绍 定义语言和本地化 导出多语言记录 导入翻译 验证翻译 调整翻译 Axelor简介 2024年6月份Axelor ERP发布了8.1版本,适配JDK11及PostgreSQL12及以上版本(7及以前版本适配JDK8及PostgreSQL10)数据库。v8版本较之前…

kubernetes集群部署:node节点部署和cri-docker运行时安装(四)

安装前准备 同《kubernetes集群部署:环境准备及master节点部署(二)》 安装cri-docker 在 Kubernetes 1.20 版本之前,Docker 是 Kubernetes 默认的容器运行时。然而,Kubernetes 社区决定在 Kubernetes 1.20 及以后的…

昇思MindSpore学习入门-评价指标

当训练任务结束,常常需要评价函数(Metrics)来评估模型的好坏。不同的训练任务往往需要不同的Metrics函数。例如,对于二分类问题,常用的评价指标有precision(准确率)、recall(召回率&…

代码随想录算法训练Day58|LeetCode417-太平洋大西洋水流问题、LeetCode827-最大人工岛

太平洋大西洋水流问题 力扣417-太平洋大西洋水流问题 有一个 m n 的矩形岛屿,与 太平洋 和 大西洋 相邻。 “太平洋” 处于大陆的左边界和上边界,而 “大西洋” 处于大陆的右边界和下边界。 这个岛被分割成一个由若干方形单元格组成的网格。给定一个…

调度系统揭秘(下):调度算法与架构设计

文章目录 一、调度算法1.1、广度优先:1.2、深度优先1.3、总结广度优先搜索(BFS)深度优先搜索(DFS) 二、架构设计2.1、Master/Slave架构优劣分析 2.2、Leader架构优劣分析 2.3、总结 一、调度算法 在调度系统中,调度算…

【】AI八股-神经网络相关

Deep-Learning-Interview-Book/docs/深度学习.md at master amusi/Deep-Learning-Interview-Book GitHub 网上相关总结: 小菜鸡写一写基础深度学习的问题(复制大佬的,自己复习用) - 知乎 (zhihu.com) CV面试问题准备持续更新贴 …

本安防爆手机:危险环境下的安全通信解决方案

在石油化工、煤矿、天然气等危险环境中,通信安全是保障工作人员生命安全和生产顺利进行的关键。防爆智能手机作为专为这些环境设计的通信工具,提供了全方位的安全通信解决方案。 防爆设计与材料: 防爆智能手机采用特殊的防爆结构和材料&…

机械硬盘故障分析及损坏处理(坏道屏蔽)

机械硬盘故障分析: 1、加电后没有声音就是电机不转,是电路问题,更换电路板解决。 2、加电后电机转,有连续敲击声音,或有异响,磁头损坏或机械故障。 3、加电后电机转,运行正常,BIOS无…

建立数据通路(一)

指令周期(Instruction Cycle) 指令种类 Fetch(取得指令) 也就是从PC寄存器里找到对应的指令地址,根据指令地址从内存里把具体的指令,加载到指令寄存器中然后把PC寄存器自增,好在未来执行下一条指令 Decode(指令译码) 也就是根据指令寄存器里…

Apache Seata新特性支持 -- undo_log压缩

本文来自 Apache Seata官方文档,欢迎访问官网,查看更多深度文章。 本文来自 Apache Seata官方文档,欢迎访问官网,查看更多深度文章。 Apache Seata新特性支持 – undo_log压缩 Seata新特性支持 – undo_log压缩 现状 & 痛点…

类与对像(1)

好几个月没有写了,差了好多,这些天补回来吧。 接下来,让我们正式步入C与C语言开始不同的地方。 我对类的理解:类是对于具有相同或相似属性的数据集合。 类的关键词:class,public,protected&a…

2024年加密货币市场展望:L1、L2、LSD、Web3 和 GameFi 板块的全面分析与预测

随着区块链技术的快速发展,加密货币市场在2024年继续展现出蓬勃的生机和创新的潜力。本文将深入分析L1、L2、LSD、Web3和GameFi这五大板块的发展趋势和预测,帮助投资者和爱好者更好地理解和把握市场机遇。 一、L1:基础层协议的持续进化 L1&a…

python自动化办公之cryptography加密解密

目录 用到的库 实现效果 代码部分 1、加密2024.txt文件 2、解密2024.txt文件 用到的库 cryptography 实现效果 加密文件和解密文件 代码部分 1、加密2024.txt文件 # 加密 from cryptography.fernet import Fernet # 生成加密密钥 keyFernet.generate_key() cipher_s…

K8S 部署 EFK

安装说明 系统版本为 Centos7.9 内核版本为 6.3.5-1.el7 K8S版本为 v1.26.14 ES官网 开始安装 本次安装使用官方ECK方式部署 EFK,部署的是当前的最新版本。 在 Kubernetes 集群中部署 ECK 安装自定义资源 如果能打开这个网址的话直接用这个命令安装,打不开的话…

创建一个不带框架的javaweb工程

点击新建 选择Maven,然后在Archetype里面选择 webapp选项(注意这里需要配置好Maven的环境 如果没配好Maven引入依赖的时候会引不进来) 如果Maven配置之后就会显示配置成功 然后我们要配置tomacat的依赖 jde选择默认 然后点击部署 选择工件&a…