1.基本数据类型
示例:
-- 创建表并定义列的数据类型
CREATE TABLE data_types_example (
tinyint_column TINYINT,
smallint_column SMALLINT,
int_column INT,
bigint_column BIGINT,
boolean_column BOOLEAN,
float_column FLOAT,
double_column DOUBLE,
string_column STRING,
timestamp_column TIMESTAMP,
binary_column BINARY
);
-- 插入示例数据
INSERT INTO data_types_example VALUES
(1, 10, 100, 1000, TRUE, 3.14, 6.28, 'example', '2024-04-23 12:00:00', CAST('binary data' AS BINARY));
-- 查询示例数据
SELECT * FROM data_types_example;
- 对于Hive的string类型相当于数据库的varchar类型,该类型是一个可变的字符串,不过它不能声明其中最多能存储多少个字符,理论上它可以存储2GB的字符数。
- 不同的数据类型具有不同的数据范围和存储大小。确保选择的数据类型可以容纳数据的范围,并且不会浪费过多的存储空间。
2.集合数据类型
Hive有三种复杂数据类型array、map和struct。array和map与Java中的array和map类似,而struct由一组称为成员的不同数据组成,其中每个成员可以具有不同的类型。
-
ARRAY:
- ARRAY是一种有序的集合,其中的元素可以重复。
- 它用于存储具有相同数据类型的多个值,例如一组数字、字符串等。
- ARRAY类型的语法为
ARRAY<data_type>
,其中data_type
表示数组中元素的数据类型。
-
MAP:
- MAP是一种键值对的集合,其中的键和值可以是任意数据类型。
- 它用于存储类似于字典或关联数组的数据结构。
- MAP类型的语法为
MAP<key_data_type, value_data_type>
,其中key_data_type
表示键的数据类型,value_data_type
表示值的数据类型。
-
STRUCT:
- STRUCT是一种类似于结构体或元组的数据类型,它可以包含多个字段,每个字段都有自己的数据类型。
- 它用于表示具有多个属性的复合数据类型。
- STRUCT类型的语法为
STRUCT<field1:data_type1, field2:data_type2, ...>
,其中field1
、field2
等表示字段名,data_type1
、data_type2
等表示字段的数据类型。
- ARRAY 示例:
一个表存储了每位学生的课程成绩,其中每个学生可能修读了多门课程,我们可以使用ARRAY来表示每位学生的成绩列表。
CREATE TABLE student_grades (
student_id INT,
grades ARRAY<INT>
);
INSERT INTO student_grades VALUES
(1, ARRAY(85, 90, 75)),
(2, ARRAY(78, 82, 95)),
(3, ARRAY(88, 92, 80));
- MAP 示例:
一个表存储了每**位员工的基本信息,其中包括姓名、部门和工资等信息,**我们可以使用MAP来表示员工的基本信息。
CREATE TABLE employee_info (
employee_id INT,
info MAP<STRING, STRING>
);
INSERT INTO employee_info VALUES
(1, MAP('name', 'Alice', 'department', 'HR', 'salary', '5000')),
(2, MAP('name', 'Bob', 'department', 'Finance', 'salary', '6000')),
(3, MAP('name', 'Charlie', 'department', 'IT', 'salary', '7000'));
- STRUCT 示例:
一个表存储了商品的详细信息,包括商品ID、名称和价格,我们可以使用STRUCT来表示商品的详细信息。
CREATE TABLE product_details (
product_id INT,
details STRUCT<
name: STRING,
price: DOUBLE
>
);
INSERT INTO product_details VALUES
(1, STRUCT('Laptop', 1200.50)),
(2, STRUCT('Smartphone', 800.25)),
(3, STRUCT('Tablet', 500.75));
3.数据类型转换
1.隐式转换
在Hive中,有时候可以进行隐式类型转换,这是指在查询中不需要显式地使用CAST函数,Hive会根据上下文自动进行类型转换。
- (1)任何整数类型都可以隐式地转换为一个范围更广的类型,如tinyint可以转换成int,int可以转换成bigint。
- (2)所有整数类型、float和string类型都可以隐式地转换成double。
- (3)tinyint、smallint、int都可以转换为float。
- (4)boolean类型不可以转换为任何其它的类型
示例:
- 整数类型转换:
- 在算术运算或比较操作中,如果参与运算的两个数类型不同,
Hive
会自动将小的整数类型转换为大的整数类型,例如将TINYINT转换为INT,INT转换为BIGINT。
SELECT 1 + 2.5; -- 将整数1隐式转换为浮点数,结果为3.5
- 字符串类型转换:
- 在字符串拼接操作中,Hive会自动将非字符串类型转换为字符串类型。
SELECT 'Age: ' || 25; -- 将整数25隐式转换为字符串,结果为'Age: 25'
- 布尔类型转换:
- 在逻辑运算中,Hive会自动将布尔类型转换为整数类型(0表示FALSE,1表示TRUE)。
SELECT TRUE AND FALSE; -- 将布尔值转换为整数,结果为0
- 日期类型转换:
- 在日期运算中,Hive会根据上下文自动进行日期类型转换。
SELECT current_date() - '2024-04-23'; -- 将字符串日期转换为日期类型,然后计算日期差
- 浮点数类型转换:
- 在算术运算中,Hive会自动进行浮点数类型转换。
SELECT 10 / 3.0; -- 将整数10隐式转换为浮点数,结果为3.33333...
2.显式转换
在Hive中,显式转换是指使用CAST函数明确指定将一个数据类型转换为另一个数据类型。
- 语法:cast(expr as ) expr表示要转换的表达式,type表示要转换成的目标数据类型。
- 返回值:Expected “=” to follow “type”
- 说明:返回转换后的数据类型
示例:
- 将字符串转换为整数:
SELECT CAST('123' AS INT);
- 将整数转换为字符串:
SELECT CAST(123 AS STRING);
- 将字符串表示的日期转换为日期类型:
SELECT CAST('2024-04-23' AS DATE);
- 将日期类型转换为字符串表示:
SELECT CAST(CURRENT_DATE() AS STRING);
- 将字符串转换为布尔类型:
SELECT CAST('true' AS BOOLEAN);
- 将布尔类型转换为字符串:
SELECT CAST(TRUE AS STRING);
- 将浮点数转换为整数:
SELECT CAST(3.14 AS INT);
- 将整数转换为浮点数:
SELECT CAST(100 AS FLOAT);
- 将时间戳转换为日期类型:
SELECT CAST('2024-04-23 12:00:00' AS DATE);