Hive笔记-4

240618-Hive笔记-4

4.2 Insert

4.2.1 将查询结果插入表中

1) 语法
INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION 
(partcol1=val1,partcol2=val2 ...)] select_stamement;

关键字说明:

(1) INTO: 将结果追加到目标表

(2) OVERWRITE: 用结果覆盖原有数据

2) 案例
(1) 新建一张表
hive (default) >
create table student1(
id int,
name string
)
row format delimited fields terminated by '\t'
(2) 根据查询结果插入数据
hive (default) > insert overwrite table student3
select 
id,
name
from student;

4.2.2 将给定Values插入表中

1) 语法
INSERT (INTO | OVERWRITE) TABLE tablename [PARTITION
(partocol1[val1],partcol2[=val2] ...] VALUES values_row [,
values_row ...]
2) 案例
hive (default) > insert into table student1
values(1,'wangwu'),(2,'zhaoliu');

追加成功:

4.2.3 将查询结果写入目标路径

1) 语法
INSERT OVERWRITE [LOCAL] DIRECTORY directory
[ROW FORMAT row_format] [STORED AS
file_format] select_statement;
2) 案例
insert overwrite local directory '/opt/module/datas/student' ROW
FORMAT SERDE 'org.apache.hadoop.hive.serde2.JsonSerDe'
select id,name from student;

4.2 Export & Import

 Export导出语句可将表的数据和元数据信息一并到处的HDFS路径,Import可将Export导出的内容导入Hive,表的数据和元数据信息都会恢复。Export和Import可用于两个Hive实例之间的数据迁移。

1) 语法

--导出
EXPORT TABLE tablename TO 'export_target_path'

--导入
IMPORT [EXTERNAL] TABLE new_or_original_tablename FROM 'source_path' [LOCATION 'import_target_path']

2) 案例

--导出
hive>
export table default.student to '/user/hive/warehouse/export/student';

--导入
hive>
import table student2 from '/user/hive/warehouse/export/student';

执行export代码:

查看结果:

执行Import代码:

第 6 章 查询

6.1 基础语法

1) 官网的地址:

LanguageManual Select - Apache Hive - Apache Software Foundation

2) 查询语句语法:

SELECT [ALL | DISTINCT] select_expr, select_expr, ...
  FROM table_reference       -- 从什么表查
  [WHERE where_condition]   -- 过滤
  [GROUP BY col_list]        -- 分组查询
   [HAVING col_list]          -- 分组后过滤
  [ORDER BY col_list]        -- 排序
  [CLUSTER BY col_list
    | [DISTRIBUTE BY col_list] [SORT BY col_list]
      ]
 [LIMIT number]                -- 限制输出的行数

6.2 基本查询(Select ... From)

6.2.1 数据准备
 (1) 原始数据
 1.在/opt/module/hive/datas/路径上创建dept.txt文件,并赋值如下内容:

部门编号 部门名称 部门位置id

[atguigu@hadoop102 datas]$ vim dept.txt

10 行政部 1700
20 财务部 1800
30 教学部 1900
40 销售部 1700
 2.在/opt/module/hive/datas/路径上创建emp.txt文件,并赋值如下内容:

员工编号 姓名 岗位   薪资  部门

[atguigu@hadoop102 datas]$ vim emp.txt

7369 张三 研发 800.00 30
7499 李四 财务 1600.00 20
7521 王五 行政 1250.00 10
7566 赵六 销售 2975.00 40
7654 侯七 研发 1250.00 30
7698 马八 研发 2850.00 30
7782 金九 \N 2450.0 30
7788 银十 行政 3000.00 10
7839 小芳 销售 5000.00 40
7844 小明 销售 1500.00 40
7876 小李 行政 1100.00 10
7900 小元 讲师 950.00 30
7902 小海 行政 3000.00 10
7934 小红明 讲师 1300.00 30

创建文件dept.txt :

(1) 创建部门表
hive (default)>
create table if not exists dept(
    deptno int,    -- 部门编号
    dname string,  -- 部门名称
    loc int        -- 部门位置
)
row format delimited fields terminated by '\t';

(2) 创建员工表
hive (default)>
create table if not exists emp(
    empno int,      -- 员工编号
    ename string,   -- 员工姓名
    job string,     -- 员工岗位(大数据工程师、前端工程师、java工程师)
    sal double,     -- 员工薪资
    deptno int      -- 部门编号
)
row format delimited fields terminated by '\t';

(3) 导入数据
hive (default)>
load data local inpath '/opt/module/hive/datas/dept.txt' into table dept;
load data local inpath '/opt/module/hive/datas/emp.txt' into table emp;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/742889.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

热敏电阻阻值和ADC采集值的转换(附10K(3950)案例)

解释:电阻阻值的转换 resistance (float)(10000 * adc_value) / (4096 - adc_value);是根据电压分压原理和ADC的转换公式来的。假设温度传感器和一个10k欧姆的电阻串联,两端接5V电源,那么温度传感器的电阻值和输出电压之间有如下关系&#…

Cell强势开启真菌组研究新篇章

人体消化系统中居住着各种各样的微生物,包括细菌、古菌、病毒和真菌。除了肠道细菌外,肠道真菌也是肠道健康微生物群的重要组成部分,过去10多年的微生态研究主要聚焦在细菌/古菌,真菌还属于暗物质,完全没有系统性认识。…

新媒体矩阵系统是什么?怎么搭建矩阵系统?

目录 前言: 一、新媒体矩阵分别是什么? 1、横向矩阵 2、 纵向矩阵 二、新媒体矩阵的作用? 1、多元化发展,吸引目标 2、多平台协同,放大宣传效果 3、多平台运营,分散风险 三、怎么做矩阵系统&…

多种驱鸟设备,在电力安全中各显神通

多种驱鸟设备,在电力安全中各显神通 鸟类对电力的危险是一个不容忽视的问题,尤其是在电力设施密集的区域。随着人类对自然环境的不断开发和利用,鸟类与电力设施之间的接触也日益频繁,由此引发的安全隐患和事故也屡见不鲜。 具体…

刷题记录6.24

438. 找到字符串中所有字母异位词https://leetcode.cn/problems/find-all-anagrams-in-a-string/ 这道题乍一看感觉很复杂。因为 异位词指由相同字母重排列形成的字符串,包括相同的字符串,那么就会有很多种组成,增加题目的复杂性。 对于这个…

星戈瑞CY5-DBCO在纳米粒子载体标记与追踪中的应用

随着纳米技术的飞速发展,纳米粒子载体在生物医学领域的应用增多。这些载体能够递送药物、基因和其他生物活性分子到特定的细胞或组织。为了有效监测纳米粒子载体在体内的分布、行为以及与生物分子的相互作用,荧光标记技术成为了一个常见工具。其中&#…

要求全国70%中医院设置康复科!康复科门诊服务这样建设!

近日,国家中医药管理局印发《国家中医药管理局关于进一步加强中医医院康复科建设的通知》提出,中医医院应根据当地人口规模及中医药康复服务需求设置康复科并作为独立科室进行建设和管理。有条件的二级以上中医医院应当按照《中医医院康复科推荐配置标准…

Redis-集群-环境搭建

文章目录 1、清空主从复制和哨兵模式留下的一些文件1.1、删除以rdb后缀名的文件1.2、删除主从复制的配置文件1.3、删除哨兵模式的配置文件 2、appendonly修改回no3、开启daemonize yes4、protect-mode no5、注释掉bind6、制作六个实例的配置文件6.1、制作配置文件redis6379.con…

使用Dropout大幅优化PyTorch模型,实现图像识别

大家好,在机器学习模型中,如果模型的参数太多,而训练样本又太少,训练出来的模型很容易产生过拟合的现象。在训练神经网络时,过拟合具体表现在模型训练数据损失函数较小,预测准确率较高,但是在测…

AI小白的大模型探险之旅:从入门到精通的奇妙旅程

前言 在数字化浪潮汹涌的时代,人工智能(AI)技术如同一位神秘的魔法师,以其强大的力量改变着世界的面貌。而在这魔法世界中,大模型技术无疑是那颗璀璨的明珠,引领着AI技术的新潮流。今天,我们就…

Hi3861 OpenHarmony嵌入式应用入门--LiteOS Semaphore做同步使用

信号量作为同步使用 创建一个Semaphore对象,并指定一个初始的计数值(通常称为“许可”或“令牌”的数量)。这个计数值表示当前可用的资源数量或可以同时访问共享资源的线程数。当一个线程需要访问共享资源时,它会尝试从Semaphore…

Sectigo或RapidSSL DV通配符SSL证书哪个性价比更高?

在当前的网络安全领域,选择一款合适的SSL证书对于保护网站和用户数据至关重要。Sectigo和RapidSSL作为市场上知名的SSL证书提供商,以其高性价比和快速的服务响应而受到市场的青睐。本文将对Sectigo和RapidSSL DV通配符证书进行深入对比,帮助用…

怎么免费SSL证书有效期越来越短了

其实说到SSL证书,很多人的第一印象都是免费SSL证书,主要是由于国内网络发展的历程相对于国外而言较晚,SSL证书的普及程度也远没有国外那么广泛,因此在国内前期的基础SSL证书会由各个云厂商和CA免费提供,之前在国内的一…

谨慎投稿!On Hold 期刊影响因子不降反升?附目前On Hold期刊影响因子变化表

【SciencePub学术】大家有没有发现一个现象,就是现在“on hold”期刊貌似越来越频繁了。一旦期刊在发文量、国人占比、引用异常、撤稿频繁等方面稍微碰触红线,便会喜提一个“on hold”标识~ 近日,2023JCR正式发布,今天小编带大家看…

Ansible自动化运维,(1)模块

ansible是基于Python语言实现的,模块化:调用特定的模块完成特定的任务,支持自定义模块,可使用任何编程语言写模块(账号,软件等)。部署简单,基于python和SSH,相对安全,基于OpenSSH。 …

论文阅读MVBench: A Comprehensive Multi-modal Video Understanding Benchmark

摘要(Abstract): 论文介绍了MVBench,这是一个全新的多模态视频理解基准测试,旨在评估多模态大型语言模型(MLLMs)在视频理解方面的能力。 目前许多基准测试主要集中在静态图像任务的空间理解上,而忽视了动…

会声会影2024免费版下载无需激活码序列号

亲爱的影像爱好者们,今天我要和大家分享的是一款让我彻底着迷的软件——会声会影2024!自从用了它,我的视频编辑技能简直突飞猛进,每次上传作品到小红书都能收获满满的赞👍。接下来,就让我带你一起探索这个神…

华为VPN通过安当ASP身份认证系统快速实现认证

华为VPN通过安当ASP身份认证系统实现认证的过程,主要涉及到Radius OTP(一次性密码)认证技术的使用。以下是实现这一过程的详细步骤: 1. 前提条件: 确保系统已经激活了Radius模块,并在安全设置中的RADIUS配…

ppdetection-2.7

1, pip install -r requirement.txt 2、 ValueError: paddle.load can not parse the file:C:\Users\HX/.cache/paddle/weights\deepsort_pcb_pyramid_r101.pdparams. 重新下载模型 3、 declarative() got an unexpected keyword argument看一下参数是否写对,比如…

Python文本挖掘数据分析——竞争分析(1)

文章目录 前言项目背景与目标品类分布分析数据准备与处理查看数据类目作图查看占比的不同 适用对象作图查看适用对象占比 产品结构分析对商品分类汇总定义作图函数拜耳安速科凌虫控 前言 数据说明: 项目背景与目标 该项目旨在分析三个品牌(拜耳、安速、科凌虫控&…