Hadoop运行搭建——系统配置和Hadoop的安装

Hadoop运行搭建

前言:
本文原文发在我自己的博客小站,直接复制文本过来,所以图片不显示(我还是太懒啦!)想看带图版的请移步我的博客小站~

Linux镜像:CentOS7

系统安装:CentOS安装参考教程

系统网卡设置:

  • 参考教程:CentOS配置静态IP

  • NAT参数:虚拟机NAT设置参数

系统配置信息:

  • hadoop100:

    • 用户名:user

    • 密码:***

    • 内网IP:192.168.62.140

本博客参考(转载)教程:Hadoop入门

声明:本博客仅作为笔者小白自己学习,作为流程记录方便自己理解

一、虚拟机环境准备

1.检查虚拟机网络

先检查虚拟机是否可以与外网连接,ping一下百度瞅瞅(如果提示没有ping命令,先下载一下网络工具包yum install net-tool)。

ping baidu.com

2.添加软件源

yum update	#养成先更新一下的好习惯
yum install -y epel-release

3.关闭防火墙

方便之后的操作,防止出现由于防火墙安全策略而产生的错误。

systemctl stop firewalld	#关闭防火墙
systemctl disable firewalld.service #关闭防火墙开机自启

4.设置用户账号(按需设置)

useradd Tom	#添加用户
passwd Tom	#修改用户密码

5.给用户添加管理员权限(按需设置)

vim /etc/sudoers	#先切换到root用户,才能执行此命令

找到%wheel(大概在99行,vim设置显示行号命令为“:set nu"),在该项下面添加刚才创建的用户的配置。

为用户添加sudo权限

在网上教程看到的注意事项:”添加user这一行不要直接放到 root行下面,因为所有用户都属于 wheel组,你先配置了user具有免密功能,但是程序执行到 %wheel行时, 该功能又被覆盖回需要密码 。所以user要放到 %wheel这行下面。“

6.创建工作文件夹

在/opt目录下创建文件夹方便一会进行文件传输,并修改所属用户和所属组。

mkdir /opt/module
mkdir /opt/software
chown user:user /opt/module
chown user:user /opt/software

7.卸载虚拟机自带JDK

虚拟机自带的JDK版本可能与Hadoop所需的JDK版本不同。如果两者版本不兼容,可能导致Hadoop无法正常运行。卸载自带JDK可以避免版本冲突、减少资源占用、降低管理复杂性,并提升Hadoop的性能。

rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps

命令解释:

rpm -qa:查询所安装的所有rpm软件包
grep -i:忽略大小写
xargs -n1:表示每次只传递一个参数
rpm -e --nodeps:强制卸载软件

8.重启虚拟机

reboot

二、克隆虚拟机

1.克隆创建虚拟机

我们需要构建好几台类似配置的虚拟机,直接克隆已配置好的hadoop100模板节省时间。

怎么克隆???直接复制虚拟机的所在文件夹,拷贝几份就可以了~

克隆虚拟机

在VM中打开刚才复制下来的虚拟机,修改一下虚拟机名称方便区分。

更改虚拟机名称

2.修改克隆虚拟机IP

不同的虚拟机设置独立IP,设置连续的IP方便处理,设置hadoop102为例,仅修改IP地址,其余不要动,103、104同理。(如果hadoop100静态IP没有就没有设置好,请参考这篇CentOS配置静态IP)

vim /etc/sysconfig/network-scripts/ifcfg-ens32 
修改虚拟机IP

3.配置克隆机主机名映射

以Hadoop102为例,其余虚拟机同样操作。

  • 修改主机名称(这步没搞清楚要干啥,先空着)
vim /etc/hostname 
  • 配置Linux克隆机主机名称映射hosts文件 打开/etc/hosts
vim /etc/hosts

添加以下映射配置(IP地址按实际修改):

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

192.168.62.140 hadoop100	#写出一条样例,方便复制粘贴
  • 重启克隆机
reboot

剩余的虚拟机重复以上操作即可(ps:记得从第2步修改克隆虚拟机IP开始~)。

  • 配置主机映射文件

以上映射文件配置完成后,修改Windows的主机映射文件。进入C:\Windows\System32\drivers\etc路径,打开 hosts文件(用记事本打开,可以看到里边空空如也),添加并保存以下内容 (和刚才在虚拟机配置的一样)。

配置Windows主机映射文件

三、安装JDK

仍然先以Hadoop103为例。

1.检查JDK

确保已卸载虚拟机自带JDK。

java -version	#先查看,如果返回版本信息则说明没有卸载
rpm -qa | grep -i java | xargs -n1 rpm -e --nodeps	#卸载JDK命令,1.7已解释

2.安装JDK

  • 下载JDK

JDK可以在主机下载好之后再通过FTP传给虚拟机(虚拟机搭建FTP服务器的方法有很多,这里不再赘述,小白可移步Linux搭建FTP服务器参考文章),由于我们使用VMware,可以直接从Windows复制粘贴到虚拟机(偷懒,想要掌握技术不建议)。

官网下载有一捏捏麻烦,下载速度也些许感人,我们直接在清华大学镜像下载openJDK8清华源JDK8下载链接

https://mirrors.tuna.tsinghua.edu.cn/Adoptium/8/jdk/x64/linux/

单击它开始下载下载JDK

下载完成之后用FTP工具传给虚拟机,传输过程省略。

这里我直接从Windows主机粘贴到虚拟机目录,一步到位hhh~

将JDK传给虚拟机
  • 将JDK导入软件工作目录

将刚才的JDK存放到/opt/software/路径下。(注意,虚拟机没有经过配置的话无法输入中文,如果懒得去配置可以鼠标选中中文部分右键复制,再在你的命令行右键粘贴。)

(小tip:在输入文件名字时过长不用一个个准确输入,只需输入文件前缀,然后按Tab键自动补全即可)

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 将JDK解压到/opt/module
tar -zxvf /opt/software/OpenJDK8U-jdk_x64_linux_hotspot_8u402b06.tar.gz -C /opt/module/

3.配置JDK环境变量

  • 配置环境变量
ls /opt/module/		#先查看当前jdk包
sudo nano /etc/profile.d/my_env.sh 
配置JDK环境变量
#JAVA_HOME
export JAVA_HOME=/opt/module/jdk8u402-b06	#这里要与刚才看到的JDK包一致
export PATH=$PATH:$JAVA_HOME/bin

引入刚配置的环境变量文件

source /etc/profile
  • 测试JDK是否可用
java -version
查看JDK版本

返回JDK版本信息,说明安装JDK成功~

四、安装Hadoop

1.安装Hadoop

  • 下载Hadoop

hadoop下载链接(有点慢,可能需要一些魔法)

  • 导入Hadoop软件包

通过FTP或者其他方式将刚下载的包导入/opt/software/目录

cp /home/user/下载/hadoop-3.3.6-aarch64.tar.gz /opt/software/
ls /opt/software/	#查看是否已复制

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

  • 解压Hadoop
tar -zxvf /opt/software/hadoop-3.3.6-aarch64.tar.gz -C /opt/module/
ls /opt/module/		#查看是否解压成功
Hadoop解压成功

2.配置Hadoop环境变量

  • 添加Hadoop环境变量
sudo vim /etc/profile.d/hadoop_env.sh

外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传

#HADOOP_HOME
export HADOOP_HOME=/opt/module/hadoop-3.3.6	#与刚才解压的Hadoop包保持一致
export PATH=$PATH:$HADOOP_HOME/bin
  • 加入新配置的环境变量
source /etc/profile
  • 检查Hadoop可用性
hadoop version
验证Hadoop可用性

返回版本信息,Hadoop安装成功并添加进环境变量~

  • 重启虚拟机

刚配置完环境变量,重启电脑检查配置是不是临时性的,避免等到用时因配置恢复而造成不知名错误.

reboot

五、配置SSH免密登录

刚刚我们配置了三台虚拟机Hadoop102、Hadoop103和Hadoop104,他们之间的配置好了主机名映射。接下来通过SSH配置交互。

1.生成SSH密钥对

  • 进入密钥存放路径
cd /home/user/.ssh/		#进入用户目录,如果没有就先创建
  • 生成密钥对

注意,我们要以用户账户生成密钥对,只有这三台虚拟机中的主要控制机才使用root账号生成密钥对。这么做的目的是权限管理。(这里贪方便我全部使用root账号生成密钥)

ssh-keygen -t rsa	#(注意密钥对的保存路径)然后摁回车3次

使用ls命令查看是否生成密钥对

生成SSH密钥对

2.上传公钥

ssh-copy-id hadoop102
ssh-copy-id hadoop103
ssh-copy-id hadoop104
上传SSH公钥

3测试SSH免密登录

ssh 'hadoop103'
测试免密登录

登陆成功。

接下来切换虚拟机重复以上操作(略)。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/444961.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

微信私信短剧机器人源码

本源码仅提供参考,有能力的继续开发 接口为api调用 云端同步 https://ys.110t.cn/api/ajax.php?actyingshilist 影视搜索 https://ys.110t.cn/api/ajax.php?actsearch&name剧名 每日更新 https://ys.110t.cn/api/ajax.php?actDaily 反馈接口 https://ys.11…

SpringCloud-Alibaba-Nacos教程

SpringCloud-Alibaba-Nacos教程 下载地址 https://github.com/alibaba/nacos/releases/tag/2.2.3 直接进入bin包 运行cmd命令 startup.cmd -m standalone 运行成功后 进入nacos可视化页面 账号密码默认都是nacos http://localhost:8848/nacos 微服务入驻Nacos服务注册…

从 iPhone 设备恢复误删微信消息的 4 种方法

您的微信消息可能会因无意删除、系统崩溃、卸载微信应用或升级过程失败而被删除。如果您遇到这种情况,您不必担心,因为您可以采取某些步骤来恢复丢失的微信历史记录。这里有 4 种方法可以帮助您从 iPhone恢复丢失的微信消息、群聊历史记录或微信联系人。…

JMH287亲测【鸣潮】一键内测风景端V1.0.2已整理并录制视频教学

资源介绍: 否需要虚拟机:否 文件大小:压缩包约15G 支持系统:win7、win10、win11 硬件需求:运行内存16G 4核及以上CPU独立显卡 资源截图: 下载地址: JMH287【鸣潮】一键端 [V1.0.2]

算法学习08:Trie树(字典树)、并查集

算法学习08:Trie树(字典树)、并查集 文章目录 算法学习08:Trie树(字典树)、并查集前言一、Trie树(字典树)二、并查集1.例题1:合并 判断2.例题2:合并 判断 …

ChatGPT发不出消息?GPT发不出消息怎么办?

前言 今天发现,很多人的ChatGPT无法发送信息,我就登陆看一下自己的GPT的情况,结果还真的无法发送消息,ChatGPT 无法发送消息,但是能查看历史的对话,不过通过下面的方法解决了。 第一时间先打开官方的网站&a…

STM32---通用定时器(一)理论基础

写在前面:在STM32F103中有众多的定时器,其中包括两个基本定时器,基本定时器的内容已经在上节进行了介绍,基本定时器的功能、结构、使用都较为简单。而STM32F1中还含有4个通用定时器(TIM2\3\4\5),这些定时器…

Unity零基础到进阶 | Unity中 屏蔽指定UI点击事件 的多种方法整理

Unity零基础到进阶 | Unity中 屏蔽指定UI点击事件 的多种方法整理一、Unity中 屏蔽透明区域的点击事件1.1 使用Image组件自带的参数检测1.2 根据点击的坐标计算该点的像素值是否满足阈值 二、Unity中屏蔽 不规则图片按钮点击的事件 总结 🎬 博客主页:htt…

剑指offer经典题目整理(二)

一、斐波那契数列(fib) 1.链接 斐波那契数列_牛客题霸_牛客网 (nowcoder.com) 2.描述 斐波那契数列就是数列中任意一项数字,都会等于前两项之和,满足f(n) f(n-1) f(n-2) 的一个数列,例如:1 1 2 3 5 8…

JVM知识整体学习

前言:本篇没有任何建设性的想法,只是我很早之前在学JVM时记录的笔记,只是想从个人网站迁移过来。文章其实就是对《深入理解JVM虚拟机》的提炼,纯基础知识,网上一搜一大堆。 一、知识点脑图 本文只谈论HotSpots虚拟机。…

2024年腾讯云8核16G服务器性能测试和并发数测试

腾讯云8核16G轻量服务器CPU性能如何?18M带宽支持多少人在线?轻量应用服务器具有100%CPU性能,18M带宽下载速度2304KB/秒,折合2.25M/s,系统盘为270GB SSD盘,月流量3500GB,折合每天116.6GB流量&…

开源的Java图片处理库介绍

在 Java 生态系统中,有几个流行的开源库可以用于图片处理。这些库提供了丰富的功能,如图像缩放、裁剪、颜色调整、格式转换等。以下是几个常用的 Java 图片处理库的介绍,包括它们的核心类、主要作用和应用场景,以及一些简单的例子…

spring-cloud-openfeign 3.0.0之前版本(对应spring boot 2.4.x之前版本)feign配置加载顺序

在之前写的文章配置基础上 https://blog.csdn.net/zlpzlpzyd/article/details/136060312 下图为自己整理的

Linux:kubernetes(k8s)prestop事件的使用(10)

他的作用是在结束pod容器之后进行的操作 apiVersion: v1 # api文档版本 kind: Pod # 资源对象类型 metadata: # pod相关的元数据,用于描述pod的数据name: nginx-po # pod名称labels: # pod的标签type: app #这个是随便写的 自定义的标签version: 1.0.0 #这个…

借助 Terraform 功能协调部署 CI/CD 流水线-Part 1

在当今快节奏的开发环境中,实现无缝、稳健的 CI/CD 流水线对于交付高质量软件至关重要。在本文中,我们将向您介绍使用 Bitbucket Pipeline、ArgoCD GitOps 和 AWS EKS 设置部署的步骤,所有步骤都将利用 Terraform 的强大功能进行编排。在Part…

Linux 之二:CentOS7 的 IP 常用命令和配置及 xshell 基本使用方法

1. 进入虚拟机 点击右键---进入终端--输入 ip adrr 或 ifconfig 查看ip地址 下面输入命令 ifconfig(注意:不是 ipconfig ) 或 ip addr 来查看当前系统 IP 查看到IP 后,比如:上面是 192.168.184.137 1.1 IP 常用命令…

[VulnHub靶机渗透] Nullbyte

🍬 博主介绍👨‍🎓 博主介绍:大家好,我是 hacker-routing ,很高兴认识大家~ ✨主攻领域:【渗透领域】【应急响应】 【Java、PHP】 【VulnHub靶场复现】【面试分析】 🎉点赞➕评论➕收…

【MATLAB】MATLAB学习笔记

MATLAB入门 基础操作变量命名数据类型逻辑和流程控制循环结构分支结构 绘图基本操作二维平面绘图绘图参数三位立体绘图图像窗口的分割 本文参考B站视频:BV13D4y1Q7RS 由于我对于C语言很熟悉,很多语法是会参考C来学 基础操作 清屏%% 清空环境变量及命令 …

前端vite+vue3——可视化页面性能耗时指标(fmp、fp)

文章目录 ⭐前言💖vue3系列文章 ⭐可视化fmp、fp指标💖 MutationObserver 计算 dom的变化💖 使用条形图展示 fmp、fp时间 ⭐项目代码⭐结束 ⭐前言 大家好,我是yma16,本文分享关于 前端vitevue3——可视化页面性能耗时…

论文阅读:Diffusion Model-Based Image Editing: A Survey

Diffusion Model-Based Image Editing: A Survey 论文链接 GitHub仓库 摘要 这篇文章是一篇基于扩散模型(Diffusion Model)的图片编辑(image editing)方法综述。作者从多个方面对当前的方法进行分类和分析,包括学习…