二百四十四、Hive——Hive中解析复杂JSON,既有对象还有数组,而且数组中包含数组

一、目的

由于协议修改,修改后的原始数据JSON更加复杂,导致Hive中解析的难度更大,搞了一天,还好同事发了篇知乎文章,终于得以解决,天哪,太不容易了

二、数据协议案例

{
    "deviceNo": "39",
    "sourceDeviceType": null,
    "sn": null,
    "model": null,
    "createTime": "2024-07-16 07:30:00",
    "data
": {
        "cycle": 300,
        "sectionList": [{

            "sectionNo": 1,
            "coilList": [{

                "laneNo": 1,
                "laneType": null,
                "coilNo": 1,
                "volumeSum": 2,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 2,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 29.65,
                "timeOccupancy": 0.63,
                "averageHeadway": 154.79,
                "averageGap": 153.49,
                "speed85": 40.0

            },
            {
                "laneNo": 2,
                "laneType": null,
                "coilNo": 2,
                "volumeSum": 5,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 5,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 23.35,
                "timeOccupancy": 2.99,
                "averageHeadway": 123.27,
                "averageGap": 121.08,
                "speed85": 34.0
            },
            {
                "laneNo": 3,
                "laneType": null,
                "coilNo": 3,
                "volumeSum": 9,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 9,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 26.22,
                "timeOccupancy": 4.52,
                "averageHeadway": 36.98,
                "averageGap": 35.49,
                "speed85": 36.0
            },
            {
                "laneNo": 4,
                "laneType": null,
                "coilNo": 4,
                "volumeSum": 10,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 10,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 39.47,
                "timeOccupancy": 2.69,
                "averageHeadway": 34.73,
                "averageGap": 33.78,
                "speed85": 56.0
            }]
        },
        {
            "sectionNo": 2,
            "coilList": [{
                "laneNo": 5,
                "laneType": null,
                "coilNo": 5,
                "volumeSum": 1,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 1,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 32.74,
                "timeOccupancy": 0.57,
                "averageHeadway": 618.59,
                "averageGap": 617.59,
                "speed85": 32.74
            },
            {
                "laneNo": 6,
                "laneType": null,
                "coilNo": 6,
                "volumeSum": 3,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 3,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 39.27,
                "timeOccupancy": 0.37,
                "averageHeadway": 125.1,
                "averageGap": 124.26,
                "speed85": 49.0
            },
            {
                "laneNo": 7,
                "laneType": null,
                "coilNo": 7,
                "volumeSum": 4,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 4,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 49.15,
                "timeOccupancy": 0.96,
                "averageHeadway": 91.65,
                "averageGap": 91.05,
                "speed85": 54.0
            },
            {
                "laneNo": 8,
                "laneType": null,
                "coilNo": 8,
                "volumeSum": 1,
                "volumePerson": 0,
                "volumeCarNon": 0,
                "volumeCarSmall": 1,
                "volumeCarMiddle": 0,
                "volumeCarBig": 0,
                "speedAvg": 60.2,
                "timeOccupancy": 0.17,
                "averageHeadway": 50.3,
                "averageGap": 49.7,
                "speed85": 60.2
            }]
        }]
    }
}

三、参考知乎文章链接

https://zhuanlan.zhihu.com/p/461838868

四、HiveSQL

1.首先,解析出第一层、第二层、第三层JSON

select
       get_json_object(statistics_json,'$.deviceNo')          device_no,
       get_json_object(statistics_json,'$.sourceDeviceType')  source_device_type,
       get_json_object(statistics_json,'$.sn')                sn,
       get_json_object(statistics_json,'$.model')             model,
       get_json_object(statistics_json,'$.createTime')        create_time ,
       get_json_object(statistics_json,'$.data.cycle')        cycle,
       get_json_object(replace(replace(section_list,':{',':[{'),'}}','}]}'),'$.sectionNo') section_no,
       section_list
from hurys_dc_ods.ods_statistics
lateral view explode(split(replace(replace(replace(get_json_object(statistics_json,'$.data.sectionList'),'[',''),']',''),'},{"sectionNo"','}|{"sectionNo"'),"\\|")) tf as section_list
where day='2024-07-16'

2.然后,解析出coil_list字段里的第四层JSON

select
        t1.device_no,
        source_device_type,
        sn,
        model,
        create_time,
        cycle,
        get_json_object(coil_list,'$.laneNo')  lane_no,
        get_json_object(coil_list,'$.laneType')           lane_type,
        section_no,
        get_json_object(coil_list,'$.coilNo')             coil_no,
        get_json_object(coil_list,'$.volumeSum')          volume_sum,
        get_json_object(coil_list,'$.volumePerson')       volume_person,
        get_json_object(coil_list,'$.volumeCarNon')       volume_car_non,
        get_json_object(coil_list,'$.volumeCarSmall')     volume_car_small,
        get_json_object(coil_list,'$.volumeCarMiddle')    volume_car_middle,
        get_json_object(coil_list,'$.volumeCarBig')       volume_car_big,
        get_json_object(coil_list,'$.speedAvg')           speed_avg,
        get_json_object(coil_list,'$.speed85')            speed_85,
        get_json_object(coil_list,'$.timeOccupancy')      time_occupancy,
        get_json_object(coil_list,'$.averageHeadway')     average_headway,
        get_json_object(coil_list,'$.averageGap')         average_gap,
        substr(create_time,1,10) day
from (select
       get_json_object(statistics_json,'$.deviceNo')          device_no,
       get_json_object(statistics_json,'$.sourceDeviceType')  source_device_type,
       get_json_object(statistics_json,'$.sn')                sn,
       get_json_object(statistics_json,'$.model')             model,
       get_json_object(statistics_json,'$.createTime')        create_time ,
       get_json_object(statistics_json,'$.data.cycle')        cycle,
       get_json_object(replace(replace(section_list,':{',':[{'),'}}','}]}'),'$.sectionNo') section_no,
       section_list
from hurys_dc_ods.ods_statistics
lateral view explode(split(replace(replace(replace(get_json_object(statistics_json,'$.data.sectionList'),'[',''),']',''),'},{"sectionNo"','}|{"sectionNo"'),"\\|")) tf as section_list
where day='2024-07-16'
     ) as t1
lateral view explode(split(replace(replace(replace(get_json_object(replace(replace(section_list,':{',':[{'),'}}','}]}'),'$.coilList'),'[',''),']',''),'},','}|'),"\\|")) tf1 as coil_list;
;

3.运行SQL,验证一下

终于解决了,终于解决了!!!

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/802057.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

elasticsearch-keystore工具介绍

1、参数设置查询 命令格式: bin/elasticsearch-keystore list 2、密码密码查询 命令格式: bin/elasticsearch-keystore show 参数 例:bin/elasticsearch-keystore show xpack.security.http.ssl.keystore.secure_password

linux系统 mysql-8.0.32安装

1、下载安装文件 此处我选择的是 Archives 8.0.32版本 2、上传文件到linux服务器 此处省略 3、卸载旧版本mysql // 查看现有mysql: rpm -qa|grep -i mysql// 查看mysql状态 systemctl status mysqld.service// 若为启用状态,则停止 systemctl stop…

html5——CSS列表样式属性

list-style-type list-style-image list-style-position list-style eg: li { list-style:none; }【去除前面的黑点】

对象存储解决方案:高性能分布式对象存储系统MinIO

文章目录 引言I 自动化数据管理界面1.1 图形用户界面:GUI1.2 命令行界面:MinIO CLI1.3 应用程序编程接口:MinIO APIII 部署集成2.1 静态端口分配2.2 将NGINX用作反向代理,配置负载。III 基础概念3.1 为什么是对象存储?3.2 MinIO支持哪些系统拓扑结构?3.3 时间同步3.4 存储…

分布式 I/O 系统 BL200 Modbus TCP 耦合器

BL200 耦合器是一个数据采集和控制系统,基于强大的 32 位微处理器设计,采用 Linux 操作系统,支持 Modbus 协议,可以快速接入现场 PLC、SCADA 以及 ERP 系统, 内置逻辑控制、边缘计算应用,适用于 IIoT 和工业…

CyberVadis认证是什么

CyberVadis认证是一项全球性的、权威的、基于云的网络安全性评估和认证项目。它是由Altimeter公司开发的,专门针对云计算服务提供商、数据中心、软件即服务(SaaS)供应商、安全咨询服务公司和内部IT部门而设计的。 CyberVadis认证旨在评估和验证组织在网络安全方面的…

android中实现双列表联动功能

就是一个数据展示的功能&#xff0c;左边是目录、右边是详情列表。效果图如下&#xff1a; 实现的思路&#xff0c;就是左右一个列表&#xff0c;右边的列表里面嵌套一个列表&#xff0c;一共三个列表。 第一步&#xff1a;先写一个主页面布局文件 <?xml version"1…

在GPU上运行PyTorch

文章目录 1、查看GPU的CUDA版本2、下载CUDA版本3、安装cuDNN4、配置CUDA环境变量5、安装配置Anaconda6、使用Anaconda7、pycharm导入虚拟环境8、安装带GPU的PyTorch⭐9、总结 &#x1f343;作者介绍&#xff1a;双非本科大三网络工程专业在读&#xff0c;阿里云专家博主&#x…

轻量级自适用商城卡密发卡源码(可运营)

一款全开源非常好看的发卡源码。轻量级自适应个人自助发卡简介&#xff0c;这是一款二次开发的发卡平台源码修复原版bug,删除无用的代码。所有文件全部解密&#xff0c;只保留后台版权信息内容。大家放心使用&#xff0c;可以用于商业运营。轻量级自适应个人自助发卡。 源码下…

【海外云手机】静态住宅IP集成解决方案

航海大背景下&#xff0c;企业和个人用户对于网络隐私、稳定性以及跨国业务的需求日益增加。静态住宅IP与海外云手机的结合&#xff0c;提供了一种创新的集成解决方案&#xff0c;能够有效应对这些需求。 本篇文章分为三个部分&#xff1b;静态住宅优势、云手机优势、集成解决…

高翔【自动驾驶与机器人中的SLAM技术】学习笔记(一)——流形;

新建了一个专栏&#xff0c;仔细学习高翔的新书《自动驾驶与机器人中的SLAM技术》。 快速通读了一遍&#xff0c;发现还有很多需要深入学习的东西&#xff0c;因此二刷这本书。对于自己不懂的地方&#xff0c;通过这个笔记记录这个流程。 第一个问题&#xff1a;流形。 流形学…

Spring Boot项目的404是如何发生的

问题 在日常开发中&#xff0c;假如我们访问一个Sping容器中并不存在的路径&#xff0c;通常会返回404的报错&#xff0c;具体原因是什么呢&#xff1f; 结论 错误的访问会调用两次DispatcherServlet&#xff1a;第一次调用无法找到对应路径时&#xff0c;会给Response设置一个…

uniapp页面跳转传参和动态修改NavigationBarTitle

一、需求 比如聊天界面&#xff0c;需要在上方展示对方的名字&#xff0c;我们这样需要动态数值的&#xff0c;就不能写在pages配置项里面。 二、实现 我们并没有在pages里面配置固定的title名&#xff0c;我们需要动态传到talk&#xff0c;然后动态修改绑定到这个title。好在u…

从零开始学量化~Ptrade使用教程(六)——盘后定价交易、港股通与债券通用质押式回购

盘后固定价交易 实现科创板、创业板的盘后固定价交易&#xff0c;界面如下显示&#xff1a; 交易 输入科创板或创业板代码&#xff0c;选择委托方向&#xff0c;输入委托价格、委托数量&#xff0c;点击“买入”或“卖出”按钮进行委托。可出现一个委托提示框提示是否继续委托操…

HCNA VRP基础

交换机可以隔离冲突域&#xff0c;路由器可以隔离广播域&#xff0c;这两种设备在企业网络中应用越来越广泛。随着越来越多的终端接入到网络中&#xff0c;网络设备的负担也越来越重&#xff0c;这时网络设备可以通过专有的VRP系统来提升运行效率。通过路由平台VRP是华为公司数…

怎么录屏?Windows和Mac电脑都适用的3种方法

在数字化时代的浪潮中&#xff0c;电脑录屏已经成为一种必备技能。无论是为了制作教学视频&#xff0c;记录游戏的高光时刻、还是为了保存下欢乐时光&#xff0c;录屏功能都在我们当中发挥着重要的作用。但是怎么录屏也成为一个难题&#xff0c;有时候用的电脑不一样&#xff0…

基于搜索二叉树的停车收费管理系统

系统效果&#xff1a;录入汽车信息 查看汽车信息 收费信息查看 查询车库车辆 代码展示&#xff1a; //SearchBinaryTree.h #pragma once #include<iostream> #include<string> #include<time.h> #include<Windows.h> using namespace std;template<…

ArkTS学习笔记_UI界面的状态管理简述

ArkTS学习笔记_UI界面的状态管理简述 背景&#xff1a; 我们在UI开发中&#xff0c;绝大多数的UI界面都是动态的、有用户交互的&#xff0c;为了实现动态交互&#xff0c;引入了一个概念“状态”&#xff0c;它主要是用来记录管理UI界面的状态变化&#xff08;数据变化&#x…

08 模型演化根本 深度学习推荐算法的五大范式

易经》“九三&#xff1a;君于终日乾乾&#xff1b;夕惕若&#xff0c;厉无咎”。九三是指阳爻在卦中处于第三位&#xff0c;已经到达中位&#xff0c;惕龙指这个阶段逐渐理性&#xff0c;德才已经显现&#xff0c;会引人注目&#xff1b;但要反思自己的不足&#xff0c;努力不…

ubuntu上模拟串口通信

前言 有时候写了一些串口相关的程序&#xff0c;需要调试的时候&#xff0c;又没有硬件&#xff0c;或者需要等其他模块完成才能一起联调。这样搭建环境费时费力&#xff0c;很多问题等到最后联调才发现就已经很晚了。 本文提供一种在ubuntu环境下模拟串口&#xff0c;直接就可…