大数据:HDFS存储原理,fsck命令查看文件副本状态,namenode元数据,edits流水账,fsimage合并,hdfs读取数据

大数据:HDFS存储原理,fsck命令查看文件副本状态,namenode元数据,edits流水账,fsimage合并,hdfs读取数据

2022找工作是学历、能力和运气的超强结合体,遇到寒冬,大厂不招人,可能很多算法学生都得去找开发,测开
测开的话,你就得学数据库,sql,oracle,尤其sql要学,当然,像很多金融企业、安全机构啥的,他们必须要用oracle数据库
这oracle比sql安全,强大多了,所以你需要学习,最重要的,你要是考网络警察公务员,这玩意你不会就别去报名了,耽误时间!
与此同时,既然要考网警之数据分析应用岗,那必然要考数据挖掘基础知识,今天开始咱们就对数据挖掘方面的东西好生讲讲 最最最重要的就是大数据,什么行测和面试都是小问题,最难最最重要的就是大数据技术相关的知识笔试


文章目录

  • 大数据:HDFS存储原理,fsck命令查看文件副本状态,namenode元数据,edits流水账,fsimage合并,hdfs读取数据
    • @[TOC](文章目录)
  • 大数据:HDFS存储原理
  • fsck命令
  • namenode元数据
  • hdfs数据的读写流程
  • 总结

大数据:HDFS存储原理

在这里插入图片描述
在这里插入图片描述
一个文件,分为part123
分别存储到服务器中
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
取回来呢
也是反向的合并即可
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
划分统一单位
hdfs中叫block块
在这里插入图片描述
在这里插入图片描述
大小可以修改
在这里插入图片描述
如果丢失了一个block怎么办????
在这里插入图片描述在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
鸡蛋不要放在同一个篮子中
都有备份
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
有备份即可
安全

这就很清楚了对吧

fsck命令

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
默认3个
2个副本
不需要自己设置,基本上OK的

在这里插入图片描述
临时更改的命令
存在的文件,-setrep命令
-R命令
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述改了
1个副本了
在这里插入图片描述
fsck
files check简写,检查文件的副本个数
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
2个不同的服务器位置
在这里插入图片描述
健康的
无丢失
美滋滋

再看看1个副本的test_3呢
在这里插入图片描述
在这里插入图片描述
在102服务器上
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
本分好大啊
骚的
gg
在这里插入图片描述
都存在不同的机子上
在这里插入图片描述
一般我们不会修改的
在这里插入图片描述

namenode元数据

在这里插入图片描述在这里插入图片描述
在这里插入图片描述
流水账
edits
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
用户想查询目标文件,gg
太慢了

你要整个文件都要找,确保最后一个命令骚操作,没有动它
流水账不行的,尴尬

把流水账合并
记录最终状态LRU即可
我们只记录最后的状态,即可

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
直接用fsimage搞定
在这里插入图片描述
在这里插入图片描述
俩都行

这种是有点像那个啥了,垃圾清理策略
垃圾回收策略【python的】
在这里插入图片描述
用辅助角色搞定这个事情
secondarynamenode来搞定元数据的合并
美滋滋
edits流水账
fsimage合并流水账
在这里插入图片描述

hdfs数据的读写流程

在这里插入图片描述
在这里插入图片描述
数据写入hadoop服务器的流程
请求【client申请】
审核【namenode是老大】
给地址【去DataNode写数据】
发送数据,写【package】
备份【DataNode互相沟通,复制备份即可】
记录元数据【namenode的secondarynamenode】
结束
在这里插入图片描述
很简单的

干活就是一步一步干完事

老大namenode只负责审批和记录,不写数据哦
DataNode才是负责写数据
客户只发送一次数据,剩下的由DataNode之间来互相备份。

数据读取就更简单了
在这里插入图片描述
数据跟namenode没关系哦
它只负责审批
block列表计算网络距离,尽量把最近的给客户,这样读取速度快点
客户分批去各个block上读取即可

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
namenode自动计算


总结

提示:重要经验:

1)
2)学好oracle,即使经济寒冬,整个测开offer绝对不是问题!同时也是你考公网络警察的必经之路。
3)笔试求AC,可以不考虑空间复杂度,但是面试既要考虑时间复杂度最优,也要考虑空间复杂度最优。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/26549.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Spring Boot如何实现自定义Starter?

Spring Boot如何实现自定义Starter? 在 Spring Boot 中,Starter 是一种特殊的依赖,它可以帮助我们快速地集成一些常用的功能,例如数据库连接、消息队列、Web 框架等。在本文中,我们将介绍如何使用 Spring Boot 实现自…

web前端 --- BOM编程、DOM编程

BOM编程(browser object model -- 浏览器对象模型) BOM给JavaScript提供用来操作浏览器的若干的"方法" 操作 在 js 看来,一个完整的浏览器包含如下组件: window窗口 // 整个浏览器的窗口 |-- history …

练手必备,20个Python实战项目含源代码

“读”代码是不能给你带来任何收益的,正如“读书”一样,如果在读的时候你不琢磨,保管你读完仨月准忘了一大半。真正需要的是去“试”代码,动手去调调代码,改改这改改那,看看把A变成B这个代码的结果会有什么…

最新成果展示:AlInN/GaN DBR模型数据库的开发与应用

由于AlN和GaN之间存在较大的晶格失配和热膨胀失配,导致很难获得高质量的AlN/GaN布拉格反射镜(Distributed Bragg Reflection,DBR)结构。为解决该问题,天津赛米卡尔科技有限公司技术团队基于先进的TCAD仿真设计平台开发…

MySQL 的锁

目录 一、锁的分类 二、全局锁、表级锁、页级锁、行级锁 三、乐观锁和悲观锁 四、共享锁和排它锁 五、意向共享锁和意向排它锁 六、间隙锁、临键锁、记录锁 锁的分类和用途 一、锁的分类 1、MySQL锁可以按模式分类为: 乐观锁悲观锁。 2、按粒度分可以分为&a…

STM32H743烧录后无法识别Jlink的问题

利用Cubemx生成H743的代码,点击烧录后,无法再识别到Jlink了,只能烧录时按着复位再松开(类似51单片机)。 烧录后不运行,用keil进行debug,调试发下芯片进去内存管理错误中断。 经过不断调试发现&…

功能强大UI美观的视频答题猜歌闯关娱乐微信小程序源码

正文: 功能强大UI美观的视频答题猜歌闯关娱乐微信小程序源码下载 后台管理资源本地化带数据和视频教程,这是一款拥有后端的闯关娱乐小程序。支持个人小程序和企业小程序上线运营功能强大齐全,带数据本地化(数据在自己服务器自己管理无需担心第三方失效…

为什么电源纹波那么大?

某用户在用500MHz带宽的示波器对其开关电源输出5V信号的纹波进行测试时&#xff0c;发现纹波和噪声的峰峰值达到了900多mV&#xff08;如下图所示&#xff09;&#xff0c;而其开关电源标称的纹波的峰峰值<20mv。虽然用户电路板上后级还有LDO对开关电源的这个输出再进行稳压…

如何判断一个点是否在凸多边形内 - golang

判断一个点是否在凸多边形内的方法很多&#xff0c;此处仅给出使用向量叉积法判断点是否在凸多边形内的方法。 以下图为例说明问题&#xff1a; 原理&#xff1a; 1. 将多边形的第 i 条边的第一个顶点指向点 P 得到向量 v1&#xff0c;然后将从第一个顶点指向第二个顶点得到向…

网络安全真的那么好吗?

当你开始在网上搜索关于网络安全的学习资料&#xff0c;常常会陷入自我怀疑&#xff1a;尝试自学后能使用工具进行简单的扫描和挖洞&#xff0c;但总感觉后期学习很难有突破&#xff0c;不知道是哪里出现问题…于是又不得不推倒重来。 了解网络安全&#xff0c;首先要搞清楚下…

ES6-ES13学习笔记(5.0)

ES2022的函数 //findLast findLastIndex() ES2022 发现在电脑自带的联想浏览器不支持此函数&#xff0c;还报错了 对于ECMA的支持还和浏览器有关以及浏览器版本有关&#xff0c;然后我使用Google浏览器就可以正常使用&#xff0c; 1.扩展运算符&#xff1a;三个点... ..…

Python安装

一、Windows安装 打开官网&#xff1a;https://www.python.org/getit/ 下载exe安装包&#xff0c;双击安装默认选择路径 2、验证安装成功 cmd: python 能看到版本 cmd&#xff1a;pip 测试包管理工具 cmd&#xff1a;python -m pip install --user --upgrade pip -i https:…

高考开始了,计算机专业未来还会火吗?

2023年高考&#xff0c;今天开始第一场考试。而走出考场&#xff0c;考生们也将面临选报专业的难题。高考人数逐年攀升&#xff0c;录取率却不断下降。 过去10年&#xff0c;计算机专业可谓红透半边天&#xff0c;早早进入这个行业的&#xff0c;基本都吃到了很高的红利。然而…

java多线程面试题

一、创建线程有哪几种方式? 创建线程有三种方式&#xff0c;分别是继承Thread类、实现Runnable接口、实现Callable接口。 Runnable接口与Callable接口的方式基本相同&#xff0c;只是Callable接口里定义的方法有返回值&#xff0c;可以声明抛出异常。 二、run()和start()有什…

006-从零搭建微服务-注册中心(二)

写在最前 如果这个项目让你有所收获&#xff0c;记得 Star 关注哦&#xff0c;这对我是非常不错的鼓励与支持。 源码地址&#xff1a;https://gitee.com/csps/mingyue 文档地址&#xff1a;https://gitee.com/csps/mingyue/wikis 核心依赖 需要注册配置中心的服务引入下面 …

vuex核心

提示&#xff1a;文章写完后&#xff0c;目录可以自动生成&#xff0c;如何生成可参考右边的帮助文档 文章目录 前言一、什么是状态管理&#xff1f;二、复杂的状态管理1.随着代码越来越多&#xff0c;需要管理的状态越来越复杂&#xff0c;当多个组件共享状态时&#xff0c;单…

chatgpt赋能python:Python如何运行两次

Python如何运行两次 Python是一种高级编程语言&#xff0c;非常受欢迎&#xff0c;因为它易于学习&#xff0c;简单易用&#xff0c;开放性强&#xff0c;而且功能强大。Python常用于处理各种任务&#xff0c;包括数据分析、Web应用开发、人工智能、自动化测试等。此外&#x…

Linux ls -l输出文件信息详解

在linux中&#xff0c;我们知道一切皆为文件&#xff0c;经常我们会使用ls -l去查看文件的信息&#xff0c;今天会大家详细讲解一下ls -l输出的文件属性信息。 1.ls -l输出 命令&#xff1a; ls -l 通过ls -l命令输出&#xff0c;我们可以看到上图中的属性信息输出&#xff…

PMP证书含金量也太高了吧!在一线城市可享受多项福利~

近年来&#xff0c;企业与企业、城市与城市间的人才争夺变得更加激烈&#xff0c;各大城市为了泛集聚和培养重点领域紧缺专业人才均针对持有国际职业资格认证的人才出台了相关优惠政策&#xff0c;目前我了解到的已有以下5个城市针对PMP项目管理及相关行业和认证出台了鼓励政策…

项目管理系统的设计与实现(ASP.NET,SQL)

开发环境&#xff1a;Microsoft Visual Studio 数据库&#xff1a;Microsoft SQL Server 程序语言&#xff1a;asp.NET(C#)语言本系统的开发使各大公司所的项目管理更加方便快捷&#xff0c;同时也促使项目的管理变的更加系统化、有序化。系统界面较友好&#xff0c;易于操作。…