描述
用户-视频互动表tb_user_video_log
id | uid | video_id | start_time | end_time | if_follow | if_like | if_retweet | comment_id |
---|---|---|---|---|---|---|---|---|
1 | 101 | 2001 | 2021-10-01 10:00:00 | 2021-10-01 10:00:30 | 0 | 1 | 1 | NULL |
2 | 102 | 2001 | 2021-10-01 10:00:00 | 2021-10-01 10:00:21 | 0 | 0 | 1 | NULL |
3 | 103 | 2001 | 2021-10-01 11:00:50 | 2021-10-01 11:01:20 | 0 | 1 | 0 | 1732526 |
4 | 102 | 2002 | 2021-10-01 11:00:00 | 2021-10-01 11:00:30 | 1 | 0 | 1 | NULL |
5 | 103 | 2002 | 2021-10-01 10:59:05 | 2021-10-01 11:00:05 | 1 | 0 | 1 | NULL |
(uid-用户ID, video_id-视频ID, start_time-开始观看时间, end_time-结束观看时间, if_follow-是否关注, if_like-是否点赞, if_retweet-是否转发, comment_id-评论ID)
短视频信息表tb_video_info
id | video_id | author | tag | duration | release_time |
---|---|---|---|---|---|
1 | 2001 | 901 | 影视 | 30 | 2021-01-01 07:00:00 |
2 | 2002 | 901 | 美食 | 60 | 2021-01-01 07:00:00 |
3 | 2003 | 902 | 旅游 | 90 | 2021-01-01 07:00:00 |
(video_id-视频ID, author-创作者ID, tag-类别标签, duration-视频时长, release_time-发布时间)
问题:计算各类视频的平均播放进度,将进度大于60%的类别输出。
注:
- 播放进度=播放时长÷视频时长*100%,当播放时长大于视频时长时,播放进度均记为100%。
- 结果保留两位小数,并按播放进度倒序排序。
输出示例:
示例数据的输出结果如下:
tag | avg_play_progress |
---|---|
影视 | 90.00% |
美食 | 75.00% |
解释:
影视类视频2001被用户101、102、103看过,播放进度分别为:30秒(100%)、21秒(70%)、30秒(100%),平均播放进度为90.00%(保留两位小数);
美食类视频2002被用户102、103看过,播放进度分别为:30秒(50%)、60秒(100%),平均播放进度为75.00%(保留两位小数);
示例1
输入:
DROP TABLE IF EXISTS tb_user_video_log, tb_video_info;
CREATE TABLE tb_user_video_log (
id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
uid INT NOT NULL COMMENT '用户ID',
video_id INT NOT NULL COMMENT '视频ID',
start_time datetime COMMENT '开始观看时间',
end_time datetime COMMENT '结束观看时间',
if_follow TINYINT COMMENT '是否关注',
if_like TINYINT COMMENT '是否点赞',
if_retweet TINYINT COMMENT '是否转发',
comment_id INT COMMENT '评论ID'
) CHARACTER SET utf8 COLLATE utf8_bin;
CREATE TABLE tb_video_info (
id INT PRIMARY KEY AUTO_INCREMENT COMMENT '自增ID',
video_id INT UNIQUE NOT NULL COMMENT '视频ID',
author INT NOT NULL COMMENT '创作者ID',
tag VARCHAR(16) NOT NULL COMMENT '类别标签',
duration INT NOT NULL COMMENT '视频时长(秒数)',
release_time datetime NOT NULL COMMENT '发布时间'
)CHARACTER SET utf8 COLLATE utf8_bin;
INSERT INTO tb_user_video_log(uid, video_id, start_time, end_time, if_follow, if_like, if_retweet, comment_id) VALUES
(101, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:30', 0, 1, 1, null),
(102, 2001, '2021-10-01 10:00:00', '2021-10-01 10:00:21', 0, 0, 1, null),
(103, 2001, '2021-10-01 11:00:50', '2021-10-01 11:01:20', 0, 1, 0, 1732526),
(102, 2002, '2021-10-01 11:00:00', '2021-10-01 11:00:30', 1, 0, 1, null),
(103, 2002, '2021-10-01 10:59:05', '2021-10-01 11:00:05', 1, 0, 1, null);
INSERT INTO tb_video_info(video_id, author, tag, duration, release_time) VALUES
(2001, 901, '影视', 30, '2021-01-01 7:00:00'),
(2002, 901, '美食', 60, '2021-01-01 7:00:00'),
(2003, 902, '旅游', 90, '2020-01-01 7:00:00');
输出:
影视|90.00%
美食|75.00%
思路
为了计算平均播放进度,我们需要执行以下步骤:
- 连接两个表:通过
video_id
将用户观看日志和视频信息连接起来。 - 计算播放时长:使用
UNIX_TIMESTAMP(end_time) - UNIX_TIMESTAMP(start_time)
来获取播放时长。 - 计算播放进度:将播放时长除以视频时长,如果播放时长大于视频时长,则记为100%。
- 分组和筛选:按视频类别
tag
分组,并筛选出平均播放进度大于60%的类别。 - 结果格式化:将结果保留两位小数,并按播放进度倒序排序。
SELECT
tag,
CONCAT(
-- 使用CONCAT函数来连接字符串和数值
ROUND(
-- 使用ROUND函数来四舍五入结果到小数点后两位
AVG(
-- AVG函数计算平均值
CASE
-- CASE语句用于处理条件逻辑
WHEN (
UNIX_TIMESTAMP(a.end_time) - UNIX_TIMESTAMP(a.start_time)
) / b.duration < 1 -- 计算播放进度
THEN (
UNIX_TIMESTAMP(a.end_time) - UNIX_TIMESTAMP(a.start_time)
) / b.duration -- 如果播放时长小于视频时长,则按实际播放时长计算
ELSE 1 -- 如果播放时长大于或等于视频时长,则记为100%
END
) * 100,
-- 将计算结果乘以100转换为百分比
2 -- ROUND函数的第二个参数指定小数点后保留的位数
),
'%' -- 将百分比符号添加到结果中
) AS avg_play_progress -- 将计算结果命名为avg_play_progress
FROM
tb_user_video_log a -- 从用户视频日志表中选择数据,并给表a起别名
LEFT JOIN tb_video_info b ON a.video_id = b.video_id -- 根据视频ID将用户视频日志表和视频信息表进行左连接
GROUP BY
tag -- 根据视频类别标签进行分组
HAVING
avg_play_progress > 60 -- 筛选出平均播放进度大于60%的类别
ORDER BY
avg_play_progress DESC;
-- 按平均播放进度降序排序