【SQL经典题目】连续日期判断、同时在线人数、会话划分、间隔日期连续、日期交叉

【1.查询至少连续3天下单的用户】

思路1(使用lead):

  1. distinct user_id,create_date去重,确保每个用户每天只有一条访问记录
  2. lead(create_date,2,‘9999-12-31’) over(partition by user_id order by create_date)根据用户分区,订单日期排序,取后2行的订单日期(取不到则返回’9999-12-31’)
  3. 用datediff计算【订单日期】与【后2行订单日期】的差值,如果等于2则说明存在连续3天下单
    在这里插入图片描述
  4. 筛选出datediff等于2的记录,distinct user_id即可

思路2(使用row_number):

  1. distinct user_id,create_date去重,确保每个用户每天只有一条访问记录
  2. row_number() over(partition by user_id order by create_date)按用户分区,按访问日期排序,添加序号
  3. 每个日期与序号相减获得一个新的日期
    在这里插入图片描述
  4. group by user_id,diff对用户和新的日期进行分组,然后count()统计日期,判断count() >=3
    在这里插入图片描述

【2. 用户登录日志表user_id,visit_date 用sql查询出近30天连续访问7天以上的用户数量】
思路:

  1. 筛选近30天每个用户的访问记录,并去重确保同一个用户当天只有一条记录
  2. 对用户分组按访问日期排序,添加序号
  3. 每条记录的访问日期与对应的序号相减,获得一个新的日期字段
  4. group by用户,新的日期字段,统计个数,having筛选大于等于7
select user_id,diff,count(*) as cnt
from
(
	select 
	user_id,
	visit_date,
	date_sub(visit_date,row_number() over(partition by user_id order by visit_date)) as diff
	from 
	(
		select distinct user_id,visit_date 
		from table 
		where visit_date >= date_sub(current_date,30)
	) t1
) t2
group by user_id,diff
having cnt >= 7

【3. 计算某段时间内同时在线人数最大值】
核心思路:

按时间排序,逐条处理(从上到下累加),获取每个时刻在线人数,取最大值

具体实现:

  1. 筛选出每个人的登陆记录并加一个字段1(id,登陆时间,1) union all 每个人的登出记录并加一个字段-1(id,登出时间,-1)
  2. 按照登陆/登出时间升序排序
  3. sum()并开窗,窗口范围首行到当前行,即计算累加值(此时数据表示了每一个时刻的在线总人数)
  4. max()计算累加值中的最大值(即同时在线人数最大值)

【4. 同一个用户相邻两次访问记录小于60s,则认为属于一个会话。现需对同一会话的访问记录增加会话id字段 】(会话划分问题)
核心思路:

按每个用户的会话时间排序,找到每个用户会话的起点并加标签1,不是起点则加标签0,同一用户对标签进行累加,每个用户不同会话则会有不同的标签

思路:

  1. 对每个用户开窗并按访问时间排序,用lag()取上一次访问时间,取不到上一条则默认为0
    在这里插入图片描述

  2. 每条访问记录减去上一次访问时间,差值>60则赋值1,否则赋值0(用1表示每个会话的起点)
    在这里插入图片描述

  3. 对每个用户开窗,窗口范围首行到当前行,用sum()进行累加
    在这里插入图片描述

  4. 用user_id拼接上累加值,表示每个会话
    在这里插入图片描述

【5. 用户登陆记录表(user_id,login_datetime),每行表达一个用户何时登陆,求各用户最长的连续登陆天数(间断1天也算连续)】(间断连续日期判断问题)
核心思路1:

explode()将中间空1天的记录补充上,转化成连续日期的判断问题
(比如2条记录2021-12-03、2021-12-05 变成3条记录 2021-12-03、2021-12-04、2021-12-05)

思路1:

  1. 每个用户按照登陆日期去重
  2. 每个用户按登陆日期升序排列,用lead()取该用户下一次的登陆时间
    在这里插入图片描述
  3. 如果下次登陆日期和本次登陆日期相差为2,则用array()创建数组,包含本次登录日期、本次登录日期+1
    在这里插入图片描述
  4. 用explode()函数进行炸裂,此时就补充上了空缺日期
    在这里插入图片描述
  5. 按照【题目1】进行连续日期判断即可

核心思路2:

找到每次连续区间的起始日期,赋1,其它日期赋0,将问题转化为会话划分问题,取每个会话中的max日期-min日期,即为连续天数

思路2:

  1. 每个用户按照登陆日期去重
  2. 每个用户按登陆日期升序排列,用lag()取该用户上一次的登陆时间
    在这里插入图片描述
  3. 本次登录日期 减去 上次登录日期 >2的话则赋1,否则赋0
    在这里插入图片描述
  4. 对每个用户开窗,窗口范围首行到当前行,用sum()进行累加
    在这里插入图片描述
  5. 对每个用户、会话标签进行分组,取每个会话中max(login_date) - min(login_date) + 1即为最长连续天数。

【6. 品牌优惠周期表,记录每个品牌每个优惠活动的周期。需统计每个品牌的优惠总天数,如日期重合则只算1天】(日期交叉问题)
核心思路1:

修改每条活动周期的开始日期,将同一品牌日期重合的部分去除掉(保证每个活动周期时间不重合),然后按品牌分组,汇总(活动结束日期 - 活动开始日期+1)的天数(转化成日期不交叉的统计问题)

思路1:

  1. 每个品牌按活动开始日期排序,对品牌分区进行开窗,获取最大的结束日期max_end_date,窗口范围:首行到前一行
    在这里插入图片描述
  2. 修改每条记录的start_date,如果start_date大于max_end_date,则不变,否则开始日期改为max_end_date+1 在这里插入图片描述
  3. 若new_start_date为空,则取原始的start_date
    在这里插入图片描述
  4. 剔除new_start_date > end_date的记录
  5. 按品牌分组,sum(end_date - new_start_date + 1)获取每个品牌的总优惠天数

核心思路2:

将每个活动周期用explode展开成多个连续的日期,然后按品牌分组统计distinct日期(用distinct去掉日期的交叉),即可获得每个品牌总活动时长

思路2:

  1. 获取每个活动周期的时长
    在这里插入图片描述
  2. 使用suplit(repeat(‘,’,diff),‘,’)建立与活动周期对应的数组
    在这里插入图片描述
  3. 使用posexplode()进行炸裂,将其扩充为对应的行数,并添加上序号(也可以使用开窗函数添加序号)
    在这里插入图片描述
  4. 每个开始日期与pos相加获得新的日期
    在这里插入图片描述
  5. group by品牌,count(distinct event_date)获得每个品牌的总活动时长

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/272601.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

力扣刷题记录(19)LeetCode:279、139

279. 完全平方数 这题和上篇文章的题类似&#xff0c;直接上代码 class Solution { public:int numSquares(int n) {vector<int> dp(n1,INT_MAX);dp[0]0;//j表示背包容量&#xff0c;dp[j]表示和为n的完全平方数的最少数量for(int i0;i*i<n;i){for(int ji*i;j<n;j…

【Java】springboot

文章目录 Spingboot1、起步依赖2、构建springboot工程jar包3、springboot配置文件4、多环境配置5、maven和boot多环境兼容问题6、配置文件分类7、springboot整合mybatis Spingboot springboot用来简化spring的初始搭建以及开发过程。 比方说&#xff0c;创建一个springmvc程序…

AI时代下,如何看待“算法利维坦”?

ChatGPT的浪潮从2022年袭来后&#xff0c;至今热度不减&#xff0c;呈现出蓬勃发展的趋势。AI家居、医疗、教育、金融、公益、农业、艺术…AI真的已经走进了生活的方方面面&#xff0c;我们仿佛已经进入了AI时代&#xff0c;势不可挡。人工智能水平如此之高&#xff0c;不禁感慨…

医疗器械行业为什么要搭建自己的知识付费平台

随着医疗技术的不断进步&#xff0c;医疗器械行业正迅速发展&#xff0c;成为全球范围内的热门产业。医疗器械行业需要不断更新技术、提升产品质量、加强用户培训和推广新产品。在这个过程中&#xff0c;搭建自己的知识付费平台变得越来越重要&#xff0c;本文将深入探讨为什么…

DAY1C++

1、思维导图 2.定义自己的命名空间myspace&#xff0c;并在myspace中定义一个字符串&#xff0c;实现求字符串大小的函数。 #include <iostream>using namespace std;namespace myspace{string s1("call your name");int len_s(string s){return s1.length();…

关于Word中隐藏文本的知识,看这篇就够了

Word允许你隐藏文本&#xff0c;这样你就可以阅读或打印文档&#xff0c;就好像文本不在那里一样。这似乎毫无意义&#xff0c;因为如果你不想让别人阅读&#xff0c;为什么不删除文本呢&#xff1f;但隐藏文本确实有一些有趣的用途。让我们来看看什么是隐藏文本&#xff08;什…

Python(六)—— 自定义模块

15. 自定义模块 15.1 模块的定义与分类 15.1.1 模块的定义 一个函数封装一个功能&#xff0c;当遇到众多函数时&#xff0c;将这些相同的功能封装到一个文件中&#xff0c;那么这个存储着很多常用的功能的py文件&#xff0c;就是模块。模块就是文件&#xff0c;存放一堆常用…

Oracle 19c OCP 082考场真题解析第16题

考试科目&#xff1a;1Z0-082 考试题量&#xff1a;90 通过分数&#xff1a;60% 考试时间&#xff1a;150min 本文为云贝教育郭一军guoyJoe原创&#xff0c;请尊重知识产权&#xff0c;转发请注明出处&#xff0c;不接受任何抄袭、演绎和未经注明出处的转载。【云贝教育】Orac…

腾讯云上mysql连接不上

腾讯云服务器默认没开放&#xff0c;3306端口。 1.去腾讯云控制台 2.找到自己的服务器 3选择防火墙 4.添加规则 至此完事了。

Checkpoint 执行机制原理解析

在介绍Checkpoint的执行机制前&#xff0c;我们需要了解一下state的存储&#xff0c;因为state是Checkpoint进行持久化备份的主要角色。Checkpoint作为Flink最基础也是最关键的容错机制&#xff0c;Checkpoint快照机制很好地保证了Flink应用从异常状态恢复后的数据准确性。同时…

搞懂SkyWalking(40张图)

前言 在微服务架构中&#xff0c;一次请求往往涉及到多个模块&#xff0c;多个中间件&#xff0c;多台机器的相互协作才能完成。这一系列调用请求中&#xff0c;有些是串行的&#xff0c;有些是并行的&#xff0c;那么如何确定这个请求背后调用了哪些应用&#xff0c;哪些模块…

Python 高级(三):多线程 threading

大家好&#xff0c;我是水滴~~ 在Python中&#xff0c;threading模块提供了一种简单而强大的方式来进行多线程编程。多线程可以同时执行多个任务&#xff0c;使程序能够更有效地利用计算资源。本教程将介绍threading模块的基本概念、用法和一些常见的多线程编程模式。 文章中…

【JAVA】黑马MybatisPlus 学习笔记【终】【插件功能】

4.插件功能 MybatisPlus提供了很多的插件功能&#xff0c;进一步拓展其功能。目前已有的插件有&#xff1a; PaginationInnerInterceptor&#xff1a;自动分页TenantLineInnerInterceptor&#xff1a;多租户DynamicTableNameInnerInterceptor&#xff1a;动态表名OptimisticL…

Python 新规范 pyproject.toml 完全解析

多谢&#xff1a;thank Python从PEP 518开始引入的使用pyproject.toml管理项目元数据的方案。 该规范目前已经在很多开源项目中得以支持&#xff1a; Django 这个 Python 生态的顶级项目在 5 个月之前开始使用 pyproject.tomlPytest 这个 Python 生态测试框架的领头羊在 4 个…

HarmonyOS4.0系统性深入开发04UIAbility组件详解(下)

UIAbility组件间交互&#xff08;设备内&#xff09; UIAbility是系统调度的最小单元。在设备内的功能模块之间跳转时&#xff0c;会涉及到启动特定的UIAbility&#xff0c;该UIAbility可以是应用内的其他UIAbility&#xff0c;也可以是其他应用的UIAbility&#xff08;例如启…

java练习题之接口interface练习

1&#xff1a;关于接口和抽象类&#xff0c;下列说法正确的是&#xff08;ACD&#xff09; A.抽象类可以有构造方法&#xff0c;接口没有构造方法 B.抽象类可以有属性&#xff0c;接口没有属性 C.抽象类可以有非抽象方法&#xff0c;接口中都是抽象方法 1.8之后 D.抽象类和接…

比亚迪重磅来袭,汽车圈又要大动干戈?

12月15日&#xff0c;我盼望已久的新车————宋L正式登场&#xff01; 作为一直关注比亚迪的车主&#xff0c;这款新SUV一直处于我的观测范围内。终于在前几日&#xff0c;比亚迪宣布它将于12月15日上市&#xff0c;这对我来说无疑是个好消息。当我了解到宋L将推出后驱和四驱…

【Unity6.0+AI】Unity版的Pytorch之Sentis-把大模型植入Unity

本教程详细讲解什么Sentis。以及恶补一些人工智能神经网络的基础概念,概述了基本流程,加载模型、输入内容到模型、使用GPU让模型推理数据、输出数据。 官方文档 Unity Sentis: Use AI models in Unity Runtime | Unity 主页介绍 官方文档链接:Sentis overview | Sentis | 1…

挑战Python100题(6)

100+ Python challenging programming exercises 6 Question 51 Define a class named American and its subclass NewYorker. Hints: Use class Subclass(ParentClass) to define a subclass. 定义一个名为American的类及其子类NewYorker。 提示:使用class Subclass(Paren…

Scala安装

Scala安装使用 windows安装,配置环境变量 以下载Scala2.11为例&#xff0c;操作在Windows中安装Scala。 官网下载scala2.11&#xff1a;All Available Versions | The Scala Programming Language下载好后安装。双击msi包安装,记住安装的路径。配置环境变量&#xff08;和配…