引言
Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,类似于RDBMS(关系型数据库,如MySQL、Oracle、PgSQL),并提供类SQL的查询功能。
实验准备
1.搭建好伪分布安装模式的Hadoop的虚拟机,并配置了Linux网络。(可看我前面发布的文章)
2.apache-hive-2.3.9-bin.tar.gz
3.mysql57-community-release-el7-10.noarch.rpm
4.mysql-connector-java-5.1.49.tar.gz
实验步骤
一、将apache-hive-2.3.9-bin.tar.gz上传到主节点/opt/download目录下,切换到该目录,解压到/opt/software/hadoop目录下。
[root@master ~]# cd /opt/download
[root@master download]# tar -zxvf apache-hive-2.3.9-bin.tar.gz -C /opt/software/hadoop/
二、切换到解压目录下,修改解压后的文件名为hive239
[root@master hadoop]# mv apache-hive-2.3.9-bin/ hive239
三、配置hive的环境变量,在文件末尾添加
[root@master hadoop]# vi /etc/profile
#HIVE_HOME
export HIVE_HOME=/opt/software/hadoop/hive239/
export PATH=${HIVE_HOME}/bin:$PATH
保存并使配置生效
[root@master hadoop]# source /etc/profile
四、配置 hive-env.sh;进入到 HIVE 配置文件目录,先根据模板生成一个配置文件 hive-env.sh:
[root@master hadoop]# cd /opt/software/hadoop/hive239/conf/
[root@master conf]# cp hive-env.sh.template hive-env.sh
然后再配置 HADOOP_HOME 和 HIVE_CONF_DIR 到对应的目录:[root@master conf]# vim hive-env.sh
export HADOOP_HOME=/opt/software/hadoop/hadoop260/
export HIVE_CONF_DIR=/opt/software/hadoop/hive239/conf/
五、安装元数据库 Hive 高版本启动时,需要配置元数据库,如果采用其它数据库,请酌情替换对应步骤,这里采用 MYSQL 作为元数据库。切换到/opt/download目录下,上传mysql57-community-releaseel7-10.noarch.rpm
[root@master download]# yum -y install mysql57-community-release-el7-10.noarch.rpm --nogpgcheck(增加--nogpgcheck 选项跳过公钥检查)
六、开始安装 MySQL 服务器:
[root@master download]# yum -y install mysql-community-server --nogpgcheck
七、查看MySQL运行状态:
[root@master download]# service mysqld status