Hadoop特点和HDFS命令

Hadoop的特点

高扩展性: 可以根据数据量的增长进行扩展,可以扩展到数千台机器,每个机器都可以提供本地计算和存储资源

高容错性: 自动保存数据的多个副本,并能够在硬件故障的情况下重新分配计算任务,从而确保系统的高可用性和数据的不丢失。(默认备份3份)

HDFS的心跳机制

心跳机制:  DataNode向NameNode发送心跳信号和块报告

Hadoop中的心跳间隔默认为3秒,这个间隔时间可以通过参数dfs.heartbeat.interval进行调整

查看Hadoop 有没有正常启动 JPS

JPS: 查看当前Java进程的状态,J---java; PS ----“Process Status”

由于Hadoop的大多数守护进程都是用Java编写的,所以jps可以帮助管理员快速检查Hadoop守护进程是否已经启动并在运行。

 hdfs dfs

hdfs  dfs 命令相当于help命令,回车后会显示HDFS支持的所有命令 

hdfs dfs是所有hdfs命令的前缀

创建目录 mkdir

即  hdfs dfs -mkdir  绝对路径

在服务器终端上访问HDFS时所有路径必须是绝对路径, 因为当前环境是linux

在HDFS中,ls 默认加文件属性,没有ll选项

-p即"parent",允许递归创建目录,即如果指定的目录路径中包含多个层级,那么 -p 选项会确保所有父级目录都被创建。如果没有 -p 选项,当父目录不存在时,命令会失败。

上传文件 put

put 最常见的上传命令,用于将本地文件系统中的一个或多个文件复制到HDFS中。该命令在上传完成后会保留本地文件.

  • 如果目标路径已存在,该命令会覆盖现有文件,除非使用了 -f(force)选项来禁止覆盖。

  • 使用 -p 选项可以保留本地文件的属性,如权限和时间戳,  这样,上传到HDFS的文件将具有与本地文件相同的元数据。"preserve"

move不保留本地文件,copy保留本地文件

创建空文件 touchz

如果指定的文件已经存在,该命令不会覆盖现有文件。

需要有路径

generic options  通用选项,

-f ----force 强制

P----"preserve"保留

D----"define"定义

注:

分布式文件系统(如Hadoop的HDFS)本身并不包含文本编辑器,如vim。在分布式文件系统中编辑文件,通常需要将文件从分布式文件系统下载到本地文件系统,然后使用本地的文本编辑器(如vim)进行编辑。编辑完成后,你可以使用分布式文件系统的命令(如hdfs dfs -put)将修改后的文件重新上传到分布式文件系统中。

追加内容 appendToFile

把本地文件的内容上传到hdfs的文件里
Hue文件浏览器的变化
上传前
执行上传命令并刷新后

查看目录 ls 

-d   "directory"

-h "human-readable"

-R "recursive"

在HDFS中,ls 默认加文件属性,没有ll选项

查看文件内容 cat /tail

cat 命令解释

[-ignoreCrc]hdfs dfs -cat 命令的一个可选参数,其作用是在查看文件内容时忽略CRC校验。CRC(Cyclic Redundancy Check)是一种用于检测数据传输错误的校验方法。在HDFS中,每个文件块都有一个关联的CRC值,用于验证数据的完整性。

使用 -ignoreCrc 选项时,即使CRC校验失败,命令也会显示文件的内容。这在某些情况下可能是有用的,例如,当你怀疑CRC校验失败是由于非数据损坏的原因(如网络问题)导致的,而你仍然需要查看文件内容。

<src> 是一个参数占位符,你需要将其替换为实际文件的绝对路径。"source"

tail命令解释

使用 -f 选项来持续显示文件的最后1000行,直到你手动停止命令。如果没有使用 -f 选项,命令只会显示文件的最后1000行一次,然后退出。

命令示例
注: 写绝对路径

下载文件 get / move /copy

[-p] 选项代表 "preserve"。这个选项用于保留文件的属性,如权限和时间戳

[-ignoreCrc] 选项用于忽略CRC校验

[-crc] 选项用于在文件传输过程中计算CRC校验和,以确保数据的完整性。如果文件在传输过程中损坏,CRC校验可以帮助检测到这一点。

<src> 是一个参数占位符,你需要将其替换为实际文件的绝对路径。"source"

copy和get 相同,move原文件不保留

示例

 Hue网页上下载

合并下载 getmerge

多个文件合并下载到一个文件 

[generic options]:占位符, 表示可以使用一些通用的选项来修改命令的行为

  • [-nl]:可选选项,如果指定,合并后的文件中不包含原始文件的行号。

示例

再次合并走的是覆盖

移动文件/改名 mv

移动 路径相同文件名称不同时就是改名

[generic options]通用选项

示例

复制 cp 

复制 hdfs 中的文件到 hdfs 的另一个目录

删除 rm / rmdir

删除文件

删除目录 

  • --ignore-fail-on-non-empty:这是一个可选参数,如果指定了这个参数,当尝试删除非空目录时,命令不会报错,而是忽略该操作。如果没有指定这个参数,尝试删除非空目录将导致命令执行失败。

  • <dir>:这是要删除的目录的路径。可以指定多个目录路径,用空格分隔

示例: 

查看磁盘利用率和文件大小 df /du

df 命令

du 命令 

  • du:是"disk usage"的缩写,用于估算文件或目录的磁盘空间使用量。

  • [-s]:是一个可选参数,表示仅显示指定目录的总磁盘使用量,而不显示其子目录的详细使用情况。s即sum

 

 

fs 是 Hadoop 文件系统(Hadoop FileSystem)的缩写

修改权限 chgrp, chmod, chown

 

 

 

修改文件的副本数 setrep

 

rep 即replication副本; -R即 "Recursive" 递归; w 即 "Wait"

fs 是 Hadoop 文件系统(Hadoop FileSystem)的缩写

查看文件状态 state 

只能查看当前文件的

从Hue文件浏览器上查看

判断 test

 

示例

Tue 平台

文件/目录

编辑文件

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/958679.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

LetsWave脑电数据简单ERP分析matlab(一)

LetsWave是基于matlab的一款工具包&#xff0c;类似eeglab&#xff0c;也可以对数据进行预处理。习惯使用eeglab做数据预处理的&#xff0c;可以先在eeglab中做预处理&#xff0c;然后可以保存为*.set格式&#xff0c;最后在letswave中画图。 letswave下载地址&#xff1a;htt…

深度学习|表示学习|卷积神经网络|通道 channel 是什么?|05

如是我闻&#xff1a; 在卷积神经网络&#xff08;CNN&#xff09;中&#xff0c;channel&#xff08;通道&#xff09; 是指输入或输出数据的深度维度&#xff0c;通常用来表示输入或输出的特征类型。 通道的含义 输入通道&#xff08;Input Channels&#xff09;&#xff1a;…

【机器学习】机器学习引领数学难题攻克:迈向未知数学领域的新突破

我的个人主页 我的领域&#xff1a;人工智能篇&#xff0c;希望能帮助到大家&#xff01;&#xff01;&#xff01;&#x1f44d;点赞 收藏❤ 一、引言 在数学的浩瀚领域中&#xff0c;存在着诸多长期未解的难题&#xff0c;这些难题犹如高耸的山峰&#xff0c;吸引着无数数…

2024年美赛C题评委文章及O奖论文解读 | AI工具如何影响数学建模?从评委和O奖论文出发-O奖论文做对了什么?

模型假设仅仅是简单陈述吗&#xff1f;允许AI的使用是否降低了比赛难度&#xff1f;还在依赖机器学习的模型吗&#xff1f;处理题目的方法有哪些&#xff1f;O奖论文的优点在哪里&#xff1f; 本文调研了当年赛题的评委文章和O奖论文&#xff0c;这些问题都会在文章中一一解答…

Ubuntu如何安装redis服务?

环境&#xff1a; Ubuntu22.04 WSL2 问题描述&#xff1a; 如何安装redis服务&#xff1f; 解决方案&#xff1a; 1.在 Linux 上&#xff08;如 Ubuntu/Debian&#xff09;安装 1.通过包管理工具安装 Redis 服务器&#xff1a; sudo apt update sudo apt install redis…

最新-CentOS 7安装1 Panel Linux 服务器运维管理面板

CentOS 7安装1 Panel Linux 服务器运维管理面板 一、前言二、环境要求三、在线安装四、离线安装1.点击下面1 Panel官网链接访问下载&#xff0c;如未登录或注册&#xff0c;请登录/注册后下载2.使用将离线安装包上传至目标终端/tem目录下3.进入到/tem目录下解压离线安装包4.执行…

Centos类型服务器等保测评整/etc/pam.d/system-auth

修改服务器配置文件/etc/pam.d/system-auth&#xff0c;但是&#xff0c;把一下配置放在password的配置第一行才会生效 执行命令&#xff1a;配置口令要求&#xff1a;大小写字母、数字、特殊字符组合、至少8位&#xff0c;包括强制设置root口令&#xff01; sed -i 14a pas…

OSCP - Proving Grounds - Quackerjack

主要知识点 端口转发 具体步骤 执行nmap扫描,开了好多端口&#xff0c;我先试验80和8081&#xff0c;看起来8081比较有趣 Nmap scan report for 192.168.51.57 Host is up (0.0011s latency). Not shown: 65527 filtered tcp ports (no-response) PORT STATE SERVICE …

日志收集Day005

1.filebeat的input类型之filestream实战案例: 在7.16版本中已经弃用log类型,之后需要使用filebeat,与log不同&#xff0c;filebeat的message无需设置就是顶级字段 1.1简单使用&#xff1a; filebeat.inputs: - type: filestreamenabled: truepaths:- /tmp/myfilestream01.lo…

9.中断系统、EXTI外部中断

中断系统原理 中断 中断系统是管理和执行中断的逻辑结构&#xff0c;外部中断是众多能产生中断的外设之一&#xff0c;所以本节我们就借助外部中断来学习一下中断系统。在以后学习其它外设的时候&#xff0c;也是会经常和中断打交道的。 中断&#xff1a;在主程序运行过程中…

Java如何实现反转义

Java如何实现反转义 前提 最近做的一个需求&#xff0c;是热搜词增加换一批的功能。功能做完自测后&#xff0c;交给了测试伙伴&#xff0c;但是测试第二天后就提了一个bug&#xff0c;出现了未知词 levis。第一眼看着像公司售卖的一个品牌-李维斯。然后再扒前人写的代码&…

[STM32 - 野火] - - - 固件库学习笔记 - - -十一.电源管理系统

一、电源管理系统简介 电源管理系统是STM32硬件设计和系统运行的基础&#xff0c;它不仅为芯片本身提供稳定的电源&#xff0c;还通过多种电源管理功能优化功耗、延长电池寿命&#xff0c;并确保系统的可靠性和稳定性。 二、电源监控器 作用&#xff1a;保证STM32芯片工作在…

js学习笔记(2)

一、函数 1.JavaScript 函数语法 函数就是包裹在花括号中的代码块&#xff0c;前面使用了关键词 function&#xff1a; function functionname() {// 执行代码 } 当调用该函数时&#xff0c;会执行函数内的代码。 可以在某事件发生时直接调用函数&#xff08;比如当用户点…

自动驾驶之DriveMM: All-in-One Large Multimodal Model for Autonomous Driving

1. 写在前面 工作之后,主要从事于偏工程比较多的内容, 很少有机会读论文了,但2025年,由于之前有些算法的背景, 后面可能会接触一些多模态大模型相关的工作,所以又调头有点往算法的方向偏移, 而算法呢,很重要的一点就是阅读论文。2025年,再拾起论文这块的工作。 今天…

机器学习-数据集划分

文章目录 一. 为什么要划分数据集二. 数据集划分的方法1. 留出法&#xff1a;2. 交叉验证&#xff1a;将数据集划分为训练集&#xff0c;验证集&#xff0c;测试集3. 留一法&#xff1a;4. 自助法&#xff1a; 一. 为什么要划分数据集 为了能够评估模型的泛化能力&#xff0c;可…

最新-CentOS 7 基于1 Panel面板安装 JumpServer 堡垒机

CentOS 7 基于1 Panel面板安装 JumpServer 堡垒机 一、前言二、设备要求三、环境要求四、安装4.1 环境安装4.2 JumpServer安装4.3 访问JumpServerWeb端&#xff0c;进行登录 五、登录Web控制台 一、前言 JumpServer是广受欢迎的开源堡垒机。运维必备神器&#xff01;JumpServe…

解决CentOS9系统下Zabbix 7.2图形中文字符乱码问题

操作系统&#xff1a;CentOS 9 Zabbix版本&#xff1a;Zabbix7.2 问题描述&#xff1a;主机图形中文字符乱码 解决方案&#xff1a; # 安装字体配置和中文语言包 sudo yum install -y fontconfig langpacks-zh_CN.noarch # 检查是否已有中文字体&#xff1a; fc-list :lan…

JAVA-快速排序

一、快速排序基本思想 快速排序是 Hoare 于 1962 年提出的一种二叉树结构的交换排序方法&#xff0c;其基本思想为&#xff1a; 任取待排序元素序列中的某元 素作为基准值&#xff0c;按照该排序码将待排序集合分割成两子序列&#xff0c;左子序列中所有元素均小于基准值&#…

WPF1-从最简单的xaml开始

1. 最简单的WPF应用 1.1. App.config1.2. App.xaml 和 App.xaml.cs1.3. MainWindow.xaml 和 MainWindow.xaml.cs 2. 正式开始分析 2.1. 声明即定义2.2. 命名空间 2.2.1. xaml的Property和Attribute2.2.2. xaml中命名空间2.2.3. partial关键字 学习WPF&#xff0c;肯定要先学…

Spring 框架:配置缓存管理器、注解参数与过期时间

在 Spring 框架中&#xff0c;可通过多种方式配置缓存具体行为&#xff0c;常见配置方法如下。 1. 缓存管理器&#xff08;CacheManager&#xff09;配置 基于内存的缓存管理器配置&#xff08;以SimpleCacheManager为例&#xff09; SimpleCacheManager 是 Spring 提供的简单…