Spark SQL 每年的1月1日算当年的第一个自然周, 给出日期,计算是本年的第几周

一、问题

按每年的1月1日算当年的第一个自然周
(遇到跨年也不管,如果1月1日是周三,那么到1月5号(周日)算是本年的第一个自然周, 如果按周一是一周的第一天)
计算是本年的第几周,那么 spark sql 如何写 ?

二、分析

难点 :

  1. Spark SQL 的 DAYOFWEEK 函数返回的每周第一天是周日。
  2. 边界值的处理,即第一周如何判定、第二周从哪天开始计算。

先给出 sql 关键逻辑

    CASE 
        WHEN DAYOFYEAR(your_date_column) <= 7 AND DAYOFWEEK(your_date_column) <> 2 THEN 1
        ELSE CEIL((DAYOFYEAR(your_date_column) - DAYOFWEEK(your_date_column) + 8) / 7.0)
    END AS week_number

多找一些边界值测试一下。

首先先校准每周从周一开始计算

DAYOFWEEK(your_date_column)分别返回

周日		周一 	周二 	周三		周四		周五		周六
1		2		3		4		5		6		7
这个表达式部分 CEIL((DAYOFYEAR(your_date_column) - DAYOFWEEK(your_date_column) + 8) / 7.0) 用于计算给定日期所在的周数,
特别是当年的1月1日始终作为第一周的开始,并且下一个周一开始第二周的情况下。
这里 "+8" 的部分是关键,它的作用是确保计算逻辑符合这个特殊的周定义。

解释如下:

DAYOFYEAR(your_date_column) 计算年中的天数。
DAYOFWEEK(your_date_column) 返回一周中的某一天(以周日为第一天)。
从 DAYOFYEAR 的结果中减去 DAYOFWEEK 的结果,是为了根据周日作为一周开始的标准进行调整。
在这个基础上加上 8 的目的是确保每年的1月1日到1月7日(不论1月1日是周几)都计算为第一周。
之后,除以 7 是为了将天数转换为周数,并且使用 CEIL 函数向上取整,以确保任何部分周都算作完整的一周。

举个例子,如果 your_date_column 是 2024-01-08(这是一个周二),DAYOFYEAR 为 8,DAYOFWEEK 为 3(周二),
那么计算将是 CEIL((8 - 3 + 8) / 7.0),即 CEIL(13 / 7.0),结果为 2,意味着这是第二周。

在这里插入图片描述
2023-01-01 年是周日,
那么 DAYOFWEEK(your_date_column) 返回的是 1,即本周第一天。
WEEKOFYEAR(your_date_column) 返回的是 52, 即 2022 年最后一周。
但实际上我们要求的结果应该是 2023 年的第一周。

2023-01-02 年是周一,
那么 DAYOFWEEK(your_date_column) 返回的是 2,即本周第二天。
WEEKOFYEAR(your_date_column) 返回的是 1, 即 2023 年第一周。
但实际上我们要求的结果应该是 2023 年的第二周。

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

三、验证


drop table your_table;

CREATE TABLE your_table (
    id INT,
    your_date_column DATE
);


CREATE OR REPLACE TEMPORARY VIEW temp_view AS 
SELECT 1 as id, to_date('2023-01-01', 'yyyy-MM-dd') as your_date_column
UNION ALL
SELECT 2, to_date('2023-01-02', 'yyyy-MM-dd')
UNION ALL
SELECT 3, to_date('2023-02-15', 'yyyy-MM-dd')
UNION ALL
SELECT 4, to_date('2023-12-31', 'yyyy-MM-dd')
UNION ALL
SELECT 5, to_date('2024-01-01', 'yyyy-MM-dd')
UNION ALL
SELECT 6, to_date('2024-01-02', 'yyyy-MM-dd')
UNION ALL
SELECT 5, to_date('2024-01-07', 'yyyy-MM-dd')
UNION ALL
SELECT 6, to_date('2024-01-08', 'yyyy-MM-dd');




INSERT INTO your_table
SELECT * FROM temp_view;





SELECT
    your_date_column,
    YEAR(your_date_column) AS year,
    date_format(your_date_column, 'EEEE') as WEEK,
    WEEKOFYEAR(your_date_column) as WEEK_OF_YEAR,
    DAYOFYEAR(your_date_column) as DAYOFYEAR,
    DAYOFWEEK(your_date_column) as DAYOFWEEK,
    CEIL((DAYOFYEAR(your_date_column) - DAYOFWEEK(your_date_column) + 8) / 7.0) as CEIL,
    CASE 
        WHEN DAYOFYEAR(your_date_column) <= 7 AND DAYOFWEEK(your_date_column) <> 2 THEN 1
        ELSE CEIL((DAYOFYEAR(your_date_column) - DAYOFWEEK(your_date_column) + 8) / 7.0)
    END AS week_number
from your_table;

your_date_column    year    WEEK            WEEK_OF_YEAR    DAYOFYEAR   DAYOFWEEK   CEIL    WEEK_NUMBER
2023-01-01	        2023	Sunday	        52	            1	        1	        2	    1
2023-01-02	        2023	Monday	        1	            2	        2	        2	    2
2023-02-15	        2023	Wednesday	    7	            46	        4	        8	    8
2023-12-31	        2023	Sunday	        52	            365	        1	        54	    54
2024-01-01	        2024	Monday	        1	            1	        2	        1	    1
2024-01-02	        2024	Tuesday	        1	            2	        3	        1	    1
2024-01-07	        2024	Sunday	        1	            7	        1	        2	    1
2024-01-08	        2024	Monday	        2	            8	        2	        2	    2


在这个查询中:
date_format 函数的第二个参数 'EEEE' 指定返回完整的星期名称(如 Monday, Tuesday 等)。
DAYOFYEAR(your_date_column) 计算出年中的天数。
DAYOFWEEK(your_date_column) 返回一周中的某天(以周日为一周的第一天)。
当 DAYOFYEAR 小于或等于7且 DAYOFWEEK 不等于2(不是周一)时,日期属于第一周。
否则,使用调整后的公式计算周数:减去 DAYOFWEEK 的结果,加上8,然后除以7,并向上取整。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/139919.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

C++实现查找连通域

目录 一、概述 1.1、四连通域算法 1.2、八连通域算法 1.3、种子填充法 二、代码 一、概述 图像处理中&#xff0c;查找连通域的算法是图像分割的重要方法之一。它能够将一幅图像分成若干个不重叠的区域&#xff0c;每个区域内部像素具有相似的性质&#xff0c;而不同区域…

重磅:RHCA架构师新班要开课啦:《OpenShift 企业管理(DO280)》

OpenShift 即将开班 想了解的可提前咨询 课程介绍 学习如何安装、配置和管理实例OpenShift企业版管理 (DO280) 旨在帮助系统管理员为安装、配置和管理红帽OpenShift企业版实例做好准备。OpenShift企业版是一款红帽的平台即服务(PaaS)产品&#xff0c;通过使用容器技术为各类…

Linux Zabbix企业级监控平台+cpolar实现远程访问

文章目录 前言1. Linux 局域网访问Zabbix2. Linux 安装cpolar3. 配置Zabbix公网访问地址4. 公网远程访问Zabbix5. 固定Zabbix公网地址 前言 Zabbix是一个基于WEB界面的提供分布式系统监视以及网络监视功能的企业级的开源解决方案。能监视各种网络参数&#xff0c;保证服务器系…

Linux系统上配置MySQL自动备份

1、编写Shell脚本&#xff0c;并保存为.sh文件 #!/bin/bash# 获取当前日期和时间 current_date$(date %Y%m%d) current_time$(date %H%M%S)# 设置备份文件名 path"/usr/local/mysql5.7/bak" bakFileName"dbname_backup_${current_date}_${current_time}.sql&qu…

ChineseChess.2023.11.13.01

中国象棋残局模拟器ChineseChess.2023.11.13.01

树木二维码怎么生成

众所周知&#xff0c;二维码在当今社会已经普及应用。而制作树木二维码也开始受到人们的关注。那么&#xff0c;如何制作树木二维码呢&#xff1f; 树木二维码管理系统的功能 1、基本信息查看&#xff1a;为每棵树木生成唯一的二维码&#xff0c;该二维码扫码后可以了解树木的种…

Java:异常

基本概念 在Java中将程序执行过程中发生的不正常行为称为异常 常见异常 1.算术异常 这一行告诉你异常发生的对应程序和位置 当程序出现异常后&#xff0c;将不会继续执行异常后的代码 这里异常后的abcd不会再打印 2.数组越界异常 3.空指针异常 异常体系结构 上图中Excepti…

C/C++:在#define中使用参数

文章目录 在#define中使用参数参考资料 在#define中使用参数 在#define中使用参数可以创建外形和作用与函数类似的类函数宏。带有 参数的宏看上去很像函数&#xff0c;因为这样的宏也使用圆括号。类函数宏定义的圆 括号中可以有一个或多个参数&#xff0c;随后这些参数出现在替…

RestCloud AppLink已支持的数据源有哪些?

RestCloud AppLink是什么&#xff1f; 首先&#xff0c;我们需要了解RestCloud AppLink是什么&#xff0c;AppLink是一款由RestCloud公司推出的超级应用连接器。不需要开发&#xff0c;零代码&#xff0c;低成本即可快速打通数百款应用之间的数据。通过流程搭建&#xff0c;可…

C语言实现单身狗问题(找出单身狗详解版)

今天我们用C语言来实现一个单身狗问题&#xff0c;让我们开始学习吧! 目录 1.单身狗问题初阶版&#xff08;找一只单身狗&#xff09; 代码实现 2.单身狗问题进阶版&#xff08;找两只单身狗&#xff09; 代码实现 1.单身狗问题初阶版&#xff08;找一只单身狗&#xff09;…

二十六、W5100S/W5500+RP2040树莓派Pico<WOL示例>

文章目录 1 前言2 简介2 .1 什么是Wake on LAN&#xff1f;2.2 Wake on LAN的优点2.3 Wake on LAN数据交互原理2.4 Wake on LAN应用场景 3 WIZnet以太网芯片4 Wake on LAN示例概述以及使用4.1 流程图4.2 准备工作核心4.3 连接方式4.4 主要代码概述4.5 结果演示 5 注意事项6 相关…

华为组织绩效管理——华为战略执行和落地的核心抓手(好文分享)

【导语&#xff1a;华为战略执行和落地的核心抓手是组织绩效管理。在战略管理中&#xff0c;华为和其他企业最大区别的地方就是华为更强调的是组织绩效的管理。】​ 我接触的很多企业只有个人绩效没有组织绩效&#xff0c;也就是公司的战略直接分解到个人。对于小企业而言&…

LeetCode题94,44,145,二叉树的前中后序遍历,非递归

注意&#xff1a;解题都要用到栈 一、前序遍历 题目要求 给你二叉树的根节点 root &#xff0c;返回它节点值的 前序 遍历。 示例 1&#xff1a; 输入&#xff1a;root [1,null,2,3] 输出&#xff1a;[1,2,3]示例 2&#xff1a; 输入&#xff1a;root [] 输出&#xff1a;[…

如何ThingsBoard 仪表盘中快速地构建自己的实时应用?使用html markdwon 最新值部件

众所周知&#xff0c;tb是一个非常优秀的开源物联网平台&#xff0c;当我们使用它收集了一些设备数据后&#xff0c;该如何将其更加美化&#xff0c;自由自在地显示到页面上&#xff0c;搭建一个仪表盘&#xff0c;给客户看那&#xff1f; 要显示某个遥测数据&#xff0c;或者…

金蝶云星空与金蝶云星空对接集成盘亏单查询打通盘亏单新增

金蝶云星空与金蝶云星空对接集成盘亏单查询打通盘亏单新增 接通系统&#xff1a;金蝶云星空 金蝶K/3Cloud&#xff08;金蝶云星空&#xff09;是移动互联网时代的新型ERP&#xff0c;是基于WEB2.0与云技术的新时代企业管理服务平台。金蝶K/3Cloud围绕着“生态、人人、体验”&am…

解决pikachu中RCE中文乱码的问题

这个问题我在DVWA中的RCE栏目同样遇到过&#xff0c;今天在做pikachu的RCE的时候也遇到了&#xff0c;所以特此来解决一下这个问题&#xff0c;解决方法很简单&#xff0c;在源码中加入下一行代码。 $result iconv("GBK", "UTF-8", $result);加在68行前面…

Java学习笔记(七)——面向对象编程(中级)

一、IDEA &#xff08;一&#xff09;常用的快捷键 &#xff08;二&#xff09;模版/自定义模版 二、包 &#xff08;一&#xff09;包的命名 &#xff08;二&#xff09;常用的包 &#xff08;三&#xff09;如何引入&#xff08;导入&#xff09;包 &#xff08;四&am…

腾讯云新客户服务器88元/年,540元/3年,另有5年新用户服务器

在选择云服务器时&#xff0c;首先需要考虑的是性能与配置是否与自己的需求相匹配。对于小型网站或者个人博客&#xff0c;轻量应用服务器是一个不错的选择。腾讯云双十一活动中&#xff0c;2核2G轻量应用服务器的活动优惠价为88元/年&#xff0c;2核4G轻量应用服务器的活动优惠…

如何利用大模型蒸馏出小模型实现降本

如何让小模型的推理效果在某些领域比 ChatGPT 这样的大模型还要更强&#xff1f;这篇论文提供了一个思路&#xff1a;https://arxiv.org/abs/2212.10071&#xff0c;借助思维链&#xff08;CoT&#xff09;逐步解决复杂推理任务的能力&#xff0c;可以使用大模型作为推理教师&a…

正交矩阵的定义

对于n阶矩阵A&#xff0c;如果&#xff0c;其中为单位矩阵&#xff0c;为A的转置矩阵&#xff0c;那么就称A为正交矩阵。 对于正交矩阵&#xff0c; 对于正交矩阵&#xff0c;其列向量都是单位向量&#xff0c;行向量都是单位向量