YARN详解

YARN 简介

YARN 是Yet Another Resource Negotiator的缩写。
YARN是第二代MapReduce,即MRv2,是在第一代MapReduce基础上演变而来的,主要是为了解决原始Hadoop扩展性较差,不支持多计算框架而提出的;通俗讲就是资源管理器.

  • YARN核心思想:

将 MR1 中资源管理和作业调度两个功能分开,分别由 ResourceManager 和 ApplicationMaster 进程来实现。
ResourceManager : 负责整个集群的资源管理和调度。
ApplicationMaster : 负责应用程序相关事务,比如任务调度、任务监控和容错等。

YARN 作用

YARN 采用了一种分层的集群框架,它解决了 MR1.0 一系列的缺陷,具有以下优势:

  1. 具有向后兼容性,用户在 MR1.0 上运行的作业,无需任何修改即可运行在 YARN 之上.
  2. 将JobTracker功能分解,分别由ResouceManager(资源管理)和ApplicationMaster(应用程序管理)负责,每个应用程序(节点进程)对应一个ApplicationMaster.
  3. 支持多个框架,不再是一个单纯的计算框架,而是一个框架管理器(更加抽象所以拓展性强),用户可以将各种各样的计算框架移植到YARN之上,由YARN进行统一管理和资源分配,提高集群资源的利用率.
  4. 框架升级更容易,在YARN中,各种计算框架(MR,Spark)不再是作为一个服务部署到集群的各个节点上,而是被封装成一个用户程序库(lib)存放在客户端,当需要对计算框架进行升级时,只需升级用户程序库即可.

YARN 组成

YARN 主要由
ResourceManagerNodeManagerApplicationMasterContainerScheduler
等几个组件构成。
在这里插入图片描述

ApplicationsManager

应用程序管理器
负责管理整个系统中所有应用程序,包括应用程序提交、与调度器协商资源以启动ApplicationMaster、监控ApplicationMaster运行状态并在失败时重新启动它等。

Scheduler

调度器
根据容量、队列等限制条件(如每个队列分配一定的资源,最多执行一定数量的作业等),将系统中的资源分配给各个正在运行的应用程序;
在资源紧张的情况下,可以kill掉优先级低的,来运行优先级高的任务.

ResourceManager

全局资源管理器;
由调度器(Scheduler)和应用程序管理器(ApplicationsManager)组成,
RM是一个全局的资源管理器,负责整个系统的资源管理和分配;
通俗讲就是用于管理NodeManager 节点的资源,包括cpu、内存等.

ApplicationMaster

应用程序实例管理器
管理在 YARN 内运行的每个应用程序实例.
每个应用程序对应一个 AM.
AM 负责协调来自 RM 的资源,并通过 NM监视容器的执行和资源使用(CPU、内存等的资源分配),通俗讲是管理发起的任务,随着任务创建而创建,任务的完成而结束.

NodeManager

节点管理器 是每个节点上的资源和任务管理器. 一方面,它会定时地向 RM 汇报本节点上的资源使用情况和各个Container的运行状态;
另一方面,它接收并处理来自 AM 的Container启动/停止等各种请求.

Container

容器,是 YARN 中的资源抽象 它封装了 NM 节点上的多维度资源,如内存、CPU、磁盘、网络等;
当 AM 向 RM申请资源时,RM为AM返回的资源便是用Container表示的.
YARN 会为每个任务分配一个Container,且该任务只能使用该Container 中描述的资源.

YARN 提交任务的过程

在这里插入图片描述

  1. 用户向 YARN 中提交应用程序.
  2. ResourceManager为该应用程序分配第一个Container,要求它在这个Container中启动应用程序的ApplicationMaster.
  3. ApplicationMaster首先向ResourceManager注册,目的是让用户可以直接通过ResourceManager查看应用程序的运行状态,然后它将为各个任务申请资源,并监控它的运行状态,直到运行结束.
  4. ApplicationMaster向ResourceManager 的 scheduler申请和领取资源(通过RPC协议).
  5. ApplicationMaster申请到资源后,便与对应的NodeManager通信,要求它启动任务.
  6. NodeManager启动任务。
  7. 各个任务向ApplicationMaster汇报自己的状态和进度(通过RPC协议),以便让ApplicationMaster随时掌握各个任务的运行状态,从而可以在任务失败时重新启动任务.
  8. 应用程序运行完成后,ApplicationMaster向ResourceManager注销并关闭自己.

YARN的三种调度策略

FIFO 策略

在这里插入图片描述

First In First Out,先进先出.
弊端:
没有做到资源共享;由于顺序执行任务,如果第一个是大量资源,后续任务需要等待.

举例:
有两个任务,第一个是任务需要大量资源;第二个需要少量资源,但是紧急重要任务;
此时第二个需要等待第一个执行完,才能执行.

容量调度策略

在这里插入图片描述

属于共享调度策略;将集群资源,给队列分配部分资源,每个队列互不干涉.
弊端:
某个队列突然来个大的任务,那这个大的任务不会占用其他队列资源,执行时间长,效率低.
解决:
配置弹性队列;允许队列超过自己配置的容量,但仅在其他队列没有占用资源的情况下.
容量调度 + 弹性队列 = 实现资源共享

公平调度策略

在这里插入图片描述

队列间可以互相共享资源,如果权重高的任务来了,权重低的任务会分给权重高的任务部分资源,必要时,可kill掉权重低的任务.

1.Steady Fair Share
稳定的公平份额,指Yarn根据每个队列的权重weight、最大可运行资源maxShare、最小可运行资源minShare的配置计算得到的理论上应该分配给这个队列的最大资源;
它与这个队列当前是否有app正在运行无关,只和我们在fair-scheduler.xml中的配置有关.

2.Instantaneous Fair Share
瞬时的公平份额,指的是实时动态分配的资源,它的值是随着集群资源的变动而实时变动的;
如果集群中有队列从active变为inactive(不活动的),那么剩余的队列分到的instaneous fair share都会随之变大;反之,如果有一个队列从inactive变为active,则其他队列的instaneous fair share会随之变小,即instaneous fair share会变小.

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/585397.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

node.js 解析post请求 方法二

前提:以前面发的node.js解析post请求方法一为模板,具体见 http://t.csdnimg.cn/ABaIn 此文我们运用第二种方法:使用第三方模块formidable对post请求进行解析。 1》代码难点 *** 在Node.js中使用formidable模块来解析POST请求主要涉及到处理…

读(用知云翻译)gaitedge论文

文章目录 前言摘要一、介绍二、相关工作2.1步态识别2.2端到端学习 三、跨域问题四、我们的框架4.1步法合成4.2步态对准模块 五、实验5.1设置5.2性能比较5.3消融实验5.4可视化 六、结论 前言 本篇博客仅为个人学习,全文均为知云翻译,如有翻译不当&#x…

Android中的屏幕刷新机制(动画视频形象说明机制)

一,刷新率和帧率,60hz和60fps的区别 在Android系统中,刷新率和帧率是两个不同的概念,它们各自在显示过程中扮演着不同的角色。以下是对它们的详细解释: 刷新率,单位是Hz,是指屏幕在一秒内刷新…

Python来计算 1,2,3,4 能组成多少个不相同且不重复的三位数?

我们今天的例子是 有 1,2,3,4 四个数字,它们能组成多省个互不相同且无重复的三位数?都分别是多少? 话不多说,我们先上代码 num 0 # 我们写了三个for循环,表示生成的三位数 for i…

ROS 2边学边练(41)-- 使用基于tf2_ros::MessageFilter带标记(位姿、时间...)的数据类型

前言 此篇将介绍如何利用tf2来使用传感器数据(如单声道和立体声摄像机以及雷达)。 假设我们创建了一只海龟叫turtle3,它的里程计不大好用,为了监视turtle3的活动轨迹,有台头顶摄像机被安装到该海龟的背上(负…

arp欺骗详解

目录 arp攻击原理 arp协议简介 arp攻击原理 arp实验 实验环境 实验步骤 1、使用ipconfig命令查看靶机(window10)的IP地址为下一步攻击做好准备,这一步是模拟你获取对方IP的过程 2、使用ifconfig查询查看攻击者(kali&#x…

【华为 ICT HCIA eNSP 习题汇总】——题目集19

1、(多选)以下选项中,FTP 常用文件传输类型有()。 A、ASCII 码类型 B、二进制类型 C、EBCDIC 类型 D、本地类型 考点:应用层 解析:(AB) 文件传输协议(FTP&…

Win10无法合并分区?尝试以下2种解决方法吧

若Win10无法合并分区,导致C盘无法扩容,该如何解决呢?本文将介绍如何利用磁盘管理工具和傲梅分区助手轻松解决这个问题! 为什么要合并硬盘分区? 合并硬盘分区是指将同一硬盘上的两个分区合并成一个,或者将…

K8S controller编写之Informer的原理+使用[drift]

概念 核心思想(重点)watch-list 机制 Watch 通过 HTTP 协议与 Kubernetes API Server 建立长连接,接收 Kubernetes API Server 发来的资源变更事件。Watch 操作的实现机制使用 HTTP 协议的分块传输编码——当 client-go 调用 Kubernetes API…

物联网D1——建工程,配环境,注意事项

1.STLink、JLink、USB等驱动配置keil环境配置——下载芯片对应型号的包——导入库函数源文件、Core内核文件、对应芯片系统文件。 2.学会看芯片手册 3.在STM32微控制器中,CRH通常指的是控制寄存器高位(Control Register High)。 在这种情况下…

OMG 一个方法的调用改动居然优化了一倍性能!!! ConcurrentHashMap.computeIfAbsent 学习

背景 前提:抖音小程序有qps的监控,如果说qps过低就会导致小程序被下架掉。 业务代码非常的简单 一个easy的查询 但是当并非达到 20就 会发现qps降低了10倍 业务需求实现大概这么一个链路 ok 那么此前我们在认识一下 computeIfAbsent 方法(大…

Windows使用SSH登录本机Linux虚拟机

SSH(Secure Shell),一种网络协议,可以在安全外壳下实现数据传输通信,所以主要用于计算机间加密登录,可以简单理解为远程控制。除了计算机间直接互联,在git中也可以看到,常见的协议有…

opencv基础篇 ——(十一)常用照片处理函数

改善图像的亮度(illuminationChange) 用于改善光照条件不佳导致的图像对比度低下或局部过暗/过亮的问题。该函数通过模拟全局和局部光照变化,旨在提高图像的整体视觉质量,特别是在低光照条件下,使得图像中的重要细节更加清晰可见。 函数原型…

基于python的舞蹈经验分享交流网站django+vue

1.运行环境:python3.7/python3.8。 2.IDE环境:pycharmmysql5.7/8.0; 3.数据库工具:Navicat11 4.硬件环境:windows11/10 8G内存以上 5.数据库:MySql 5.7/8.0版本; 运行成功后,在浏览器中输入&am…

什么牌子内衣洗衣机好用?五种高性价比单品一览

随着科技的进步和消费者对生活质量的要求越来越高,很多小家电被发明出来,其中讨论热度较高是内衣洗衣机。它不仅方便快捷,还能保持衣物清洁和卫生。不过现在市面上的内衣洗衣机品牌实在太多了,在选购的时候让人很犹豫,…

日本一站式软文发稿:开启你的日本市场之旅

在当今的业界里,软文发稿已经成为一种被广泛采用的营销策略。不同于硬广告的直接推销,软文发稿注重以讲故事,提供有价值的信息,借此影响和吸引读者,从而间接推广企业的产品和服务。 相对于其它地区,日本市…

单片机排队叫号系统Proteus仿真程序 有取号键和叫号键以及重复叫号键 有注释

目录 1、前言 ​ 2、程序 资料下载地址:单片机排队叫号系统Proteus仿真程序 有取号键和叫号键以及重复叫号键 有注释 1、前言 系统组成:STC89C52RCLcd1602蜂鸣器按键 具体介绍: Lcd1602排队叫号系统,有取号显示窗和叫号显示窗…

解决clickhouse 启动报错

解决clickhouse 启动报错 Error response from daemon: driver failed programming external connectivity on endpoint clickhouse-server (b42457434cebe7d8ad024d31e4fd28eae2139bb2b5046c283bea17ce4398d5b0): Error starting userland proxy: listen tcp4 0.0.0.0:8123: …

MySQL中怎么存放一条记录

2.2.1. MySQL中一行记录是怎么存储的? MySQL的数据存储在那个文件? 每创建一个 database(数据库)都会在 /var/lib/mysql/ 目录里面创建一个以 database 为名的目录,然后保存表结构和表数据的文件都会存放在这个目录里…

【软件工程与实践】(第四版)第7章习题答案详解

写在文章开头,感谢你的支持与关注!小卓不羁 第7章 一、填空题二、选择题三、简答题四、实践题 一、填空题 (1)发现软件的错误 (2)白盒法 系统的模块功能规格说明 (3)功能 &#xf…