Redis --- 使用HyperLogLog实现UV(访客量)

UVPV 是网站或应用数据分析中的常用指标,用于衡量用户活跃度和页面访问量。


    UV (Unique Visitor 独立访客)

    • 指的是在一定时间内访问过网站或应用的独立用户数量
    • 通常根据用户的 IP 地址、Cookies 或用户 ID 等来唯一标识一个用户。
    • 示例:同一个用户访问页面 3 次,仍然算作 1 个 UV。

    PV (Page View 页面访问量)

    • 指的是某个页面在一定时间内被访问的次数
    • 每次页面加载或刷新都会计为一次 PV。
    • 示例:如果一个用户打开页面并刷新 3 次,那么这 3 次都算作 3 次 PV。

    UV 是统计独立访客的数量,我们可以通过 Redis 的 Set 数据结构来实现。Set 是一个不允许重复的集合,因此可以利用这一特性避免重复计数。但是如果用户量非常大,使用 Set 来存储用户 ID 会消耗很多内存,这时可以使用 Redis 提供的 HyperLogLog 数据结构来估算 UV

    HyperLogLog 用于基数统计,能够以非常低的内存消耗计算大规模数据的基数(如独立访客数)。然而,它不会像 Set 一样准确存储所有数据,而是使用概率统计来给出一个近似值,误差通常小于 0.81% 左右,所以我们通常使用其来统计UV。 逐个存储(一个一个存储)元素到 HyperLogLog 会在某些情况下增加误差。

    Redis 提供的 HyperLogLog 命令

    • PFADD key element [element ...]:向 HyperLogLog 数据结构添加元素,Redis 将会使用这些元素估算基数。
    • PFCOUNT key [key ...]:返回一个或多个 HyperLogLog 估算的基数。

    使用 HyperLogLog 估算独立访客数(UV): 

    String userKey = "page:uv:homepage";
    String userId = "user123";  // 用户唯一标识
    jedis.pfadd(userKey, userId);  // 将用户 ID 添加到 HyperLogLog 中
    

     查询估算的 UV 数量:

    Long uvEstimate = jedis.pfcount("page:uv:homepage");
    System.out.println("估算的独立访客数:" + uvEstimate);
    

    使用 HyperLogLog 进行 UV 估算时,内存消耗较少,但是由于其是基于概率算法,因此存在一定的误差,适合用于大规模数据分析。

    @SpringBootTest
    public class HmDianPingApplicationTests {
        @Resource
        private StringRedisTemplate stringRedisTemplate;
        @Test
        public void hyperLogLogTest(){
            // 模拟庞大数据
            String[] values = new String[1000];
            int j = 0;
            for(int i = 0; i < 1000000; i++){
                j = i % 1000;
                values[j] = "user_" + i;
                if(j == 999) {
                    // 发送到Redis中
                    stringRedisTemplate.opsForHyperLogLog().add("hl2",values);
                }
            }
            // 统计数量
            Long count = stringRedisTemplate.opsForHyperLogLog().size("hl2");
            System.out.println(count);
        }
    
    }
    

    而HyperLogLog 不适合计算 PV,因为 PV 需要精确计数每一次页面访问,而 HyperLogLog 只用于估算基数。计算 PV 应该使用 Redis 的 String 类型,并通过 INCRINCRBY 命令来增加访问计数。


    HyperLogLog 是一种高效的基数估算方法,适用于大数据量场景,能够以非常低的内存消耗提供基数(UV)估算。而 PV 则需要精确计数,因此需要使用字符串计数器。逐个存储(一个一个存储)元素到 HyperLogLog 会在某些情况下增加误差。

    本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/966163.html

    如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

    相关文章

    【机器学习案列】糖尿病风险可视化及预测

    &#x1f9d1; 博主简介&#xff1a;曾任某智慧城市类企业算法总监&#xff0c;目前在美国市场的物流公司从事高级算法工程师一职&#xff0c;深耕人工智能领域&#xff0c;精通python数据挖掘、可视化、机器学习等&#xff0c;发表过AI相关的专利并多次在AI类比赛中获奖。CSDN…

    单片机之基本元器件的工作原理

    一、二极管 二极管的工作原理 二极管是一种由P型半导体和N型半导体结合形成的PN结器件&#xff0c;具有单向导电性。 1. PN结形成 P型半导体&#xff1a;掺入三价元素&#xff0c;形成空穴作为多数载流子。N型半导体&#xff1a;掺入五价元素&#xff0c;形成自由电子作为多…

    llama.cpp GGUF 模型格式

    llama.cpp GGUF 模型格式 1. Specification1.1. GGUF Naming Convention (命名规则)1.1.1. Validating Above Naming Convention 1.2. File Structure 2. Standardized key-value pairs2.1. General2.1.1. Required2.1.2. General metadata2.1.3. Source metadata 2.2. LLM2.2.…

    Conmi的正确答案——Rider中添加icon作为exe的图标

    C#版本&#xff1a;.net 8.0 Rider版本&#xff1a;#RD-243.22562.250&#xff08;非商业使用版&#xff09; 1、添加图标到解决方案下&#xff1a; 2、打开“App.xaml”配置文件&#xff0c;添加配置&#xff1a; <Applicationx:Class"ComTransmit.App"xmlns&q…

    告别手动操作!用Ansible user模块高效管理 Linux账户

    在企业运维环境中&#xff0c;服务器的用户管理是一项基础但非常重要的任务。比如&#xff0c;当有新员工加入时&#xff0c;我们需要在多台服务器上为他们创建账户并分配合适的权限。而当员工离职或岗位发生变化时&#xff0c;我们也需要迅速禁用或删除他们的账户&#xff0c;…

    C++小等于的所有奇数和=最大奇数除2加1的平方。

    缘由 三种思路解题&#xff1a;依据算术推导得到一个规律&#xff1a;小等于的所有奇数和等于最大奇数除以2加1的平方。将在后续发布&#xff0c;总计有十种推导出来的实现代码。 int a 0,aa 1,aaa 0;cin >> a; while (aa<a) aaa aa, aa 2;cout << aaa;i…

    【CPP】CPP经典面试题

    文章目录 引言1. C 基础1.1 C 中的 const 关键字1.2 C 中的 static 关键字 2. 内存管理2.1 C 中的 new 和 delete2.2 内存泄漏 3. 面向对象编程3.1 继承和多态3.2 多重继承 4. 模板和泛型编程4.1 函数模板4.2 类模板 5. STL 和标准库5.1 容器5.2 迭代器 6. 高级特性6.1 移动语义…

    深入浅出谈VR(虚拟现实、VR镜头)

    1、VR是什么鬼&#xff1f; 近两年VR这次词火遍网上网下&#xff0c;到底什么是VR&#xff1f;VR是“Virtual Reality”&#xff0c;中文名字是虚拟现实&#xff0c;是指采用计算机技术为核心的现代高科技手段生成一种虚拟环境&#xff0c;用户借助特殊的输入/输出设备&#x…

    【Redis】安装配置Redis超详细教程 / Linux版

    Linux安装配置Redis超详细教程 安装redis依赖安装redis启动redis停止redisredis.conf常见配置设置redis为后台启动修改redis监听地址设置工作目录修改密码监听的端口号数据库数量设置redis最大内存设置日志文件设置redis开机自动启动 学习视频&#xff1a;黑马程序员Redis入门到…

    [LeetCode]day16 242.有效的字母异位词

    242. 有效的字母异位词 - 力扣&#xff08;LeetCode&#xff09; 题目描述 给定两个字符串 s 和 t &#xff0c;编写一个函数来判断 t 是否是 s 的 字母异位词 示例 1: 输入: s "anagram", t "nagaram" 输出: true示例 2: 输入: s "rat"…

    [MoeCTF 2022]baby_file

    题目 <html> <title>Heres a secret. Can you find it?</title> <?phpif(isset($_GET[file])){$file $_GET[file];include($file); }else{highlight_file(__FILE__); } ?> </html> 读取flag /?filephp://filter/readconvert.base64-encode…

    Centos挂载镜像制作本地yum源,并补装图形界面

    内网环境centos7.9安装图形页面内网环境制作本地yum源 上传镜像到服务器目录 创建目录并挂载镜像 #创建目录 cd /mnt/ mkdir iso#挂载 mount -o loop ./CentOS-7-x86_64-DVD-2009.iso ./iso #前面镜像所在目录&#xff0c;后面所挂载得目录#检查 [rootlocalhost mnt]# df -h…

    判断您的Mac当前使用的是Zsh还是Bash:echo $SHELL、echo $0

    要判断您的Mac当前使用的是Zsh还是Bash&#xff0c;可以使用以下方法&#xff1a; 查看默认Shell: 打开“终端”应用程序&#xff0c;然后输入以下命令&#xff1a; echo $SHELL这将显示当前默认使用的Shell。例如&#xff0c;如果输出是/bin/zsh&#xff0c;则说明您使用的是Z…

    python 小游戏:扫雷

    目录 1. 前言 2. 准备工作 3. 生成雷区 4. 鼠标点击扫雷 5. 胜利 or 失败 6. 游戏效果展示 7. 完整代码 1. 前言 本文使用 Pygame 实现的简化版扫雷游戏。 如上图所示&#xff0c;游戏包括基本的扫雷功能&#xff1a;生成雷区、左键点击扫雷、右键标记地雷、显示数字提示…

    【重新认识C语言----文件管理篇】

    目录 ​编辑 -----------------------------------------begin------------------------------------- 引言 1. 文件的基本概念 2. 文件指针 3. 文件的打开与关闭 3.1 打开文件 3.2 关闭文件 4. 文件的读写操作 4.1 读取文件 4.1.1 使用fgetc()读取文件 4.1.2 使用fg…

    EasyExcel 导出合并层级单元格

    EasyExcel 导出合并层级单元格 一、案例 案例一 1.相同订单号单元格进行合并 合并结果 案例二 1.相同订单号的单元格进行合并2.相同订单号的总数和总金额进行合并 合并结果 案例三 1.相同订单号的单元格进行合并2.相同订单号的商品分类进行合并3.相同订单号的总数和总金额…

    WPF 进度条(ProgressBar)示例一

    本文讲述&#xff1a;WPF 进度条(ProgressBar)简单的样式修改和使用。 进度显示界面&#xff1a;使用UserControl把ProgressBar和进度值以及要显示的内容全部组装在UserControl界面中&#xff0c;方便其他界面直接进行使用。 <UserControl x:Class"DefProcessBarDemo…

    LabVIEW自定义测量参数怎么设置?

    以下通过一个温度采集案例&#xff0c;说明在 LabVIEW 中设置自定义测量参数的具体方法&#xff1a; 案例背景 ​ 假设使用 NI USB-6009 数据采集卡 和 热电偶传感器 监测温度&#xff0c;需自定义以下参数&#xff1a; 采样率&#xff1a;1 kHz 输入量程&#xff1a;0~10 V&a…

    新能源产业的质量革命:六西格玛培训如何重塑制造竞争力

    在新能源行业狂飙突进的今天&#xff0c;企业若想在全球供应链中占据高地&#xff0c;仅靠技术突破已远远不够。制造效率的毫厘之差&#xff0c;可能成为市场话语权的千里之距。某光伏巨头曾因电池片良率低于行业均值1.5%&#xff0c;导致年损失超2.3亿元——这恰恰印证了六西格…

    (11)gdb 笔记(4):设置执行方向 set exec-direction,

    &#xff08;28&#xff09;引入 record 后&#xff0c;可以 设置执行方向 set exec-direction &#xff1a; 实践&#xff1a; &#xff08;29&#xff09; &#xff08;33&#xff09; 谢谢