设计简单高效的短链系统

目录

 

引言

1. 短链系统的原理

1.1 长链接生成短码

1.2 短码映射到长链接

1.3 短码重定向

1.4 过期短 URL 清理

2. 设计与实现

2.1 数据存储

2.2 短码生成

2.3 接口设计

2.4 安全性考虑

2.5 访问性能优化


引言

        在当今数字化时代,人们对信息的分享需求不断增长,而长串复杂的URL链接却显得不够便捷和美观。为了解决这一问题,短链系统应运而生。本文将探讨设计一个简单高效的短链系统的原理与实现。

        例如在手机上会收到类似的信息,最后会被转到另外一个url,比如下面的链接会被定向到 https://page.xiaojukeji.com/active/ddpage_0IM6bugY.html?sojumpparam=gR2+gSMzQEIjGhpfDLdIwy2xcBkmZNG08Y36D09Ti90UwuMj1EccLugZQSvIuSVS&sampleId=t9dT0cXFt6O7JGe3BFOqDQ==&issueId=4124142163&origin=flicka&traceId=null

 链接上,并且这种链接有时效性,过一段时间会失效。

短链系统的简单执行流程 

 

1. 短链系统的原理

        短链系统的核心原理是通过将长URL映射到短的、容易记忆的字符串上,从而实现对原始链接的缩短。其基本流程如下:

1.1 长链接生成短码

        当用户输入或提交长URL时,系统首先会生成一个唯一的短码,可以是数字、字母组合,或者是更复杂的自定义规则。这一过程通常涉及到一种哈希算法,确保每个长链接对应一个唯一的短码。

1.2 短码映射到长链接

        生成短码后,系统需要建立一个映射关系,将短码与原始的长URL关联起来。这可以通过数据库或者缓存系统来实现,以便快速地检索和获取原链接。

1.3 短码重定向

        当用户访问短链接时,系统通过短码查找对应的原链接,并进行重定向,将用户引导至原始的长链接地址。

1.4 过期短 URL 清理

        过期短 URL 清理服务器定时启动一次,将已经超过有效期的 URL 数据删除。

2. 设计与实现

2.1 数据存储

        为了实现短码到长链接的映射,需要一个高效的数据存储系统。常见的选择包括关系型数据库(如MySQL)、NoSQL数据库(如Redis)或者分布式存储系统(如HDFS)。数据库的设计应考虑性能、可扩展性和数据一致性。

2.2 短码生成

        短码的生成可以使用基于哈希的算法,确保唯一性。另外,可以考虑使用自定义规则,比如将长码进行Base62编码,生成短码。

        将长 URL 利用 MD5 或者 SHA256 等单项散列算法,进行 Hash 计算,得到128bit 或者 256bit 的 Hash 值。然后对该 Hash 值进行 Base64 编码,得到 22个或者 43 个 Base64 字符,再截取前面的 6 个字符,就得到短 URL 了。

        但是这样得到的短 URL,可能会发生 Hash 冲突,即不同的长 URL,计算得到的短 URL 是相同的(MD5 或者 SHA256 计算得到的 Hash 值几乎不会冲突,但是 Base64 编码后再截断的 6 个字符有可能会冲突)。所以在生成的时候,需要先校验该短 URL 是否已经映射为其他的长 URL,如果是,那么需要重新计算。
        
     我们的思路:
       1)将长网址md5生成32位签名串,分为4段, 每段8个字节;
       2)对这四段循环处理, 取8个字节, 将他看成16进制串与0x3fffffff(30位1)与操作, 即超过30位的忽略处理;
       3)这30位分成6段, 每5位的数字作为字母表的索引取得特定字符, 依次进行获得6位字符串;
       4)总的md5串可以获得4个6位串; 取里面的任意一个就可作为这个长url的短url地址;

 代码

 public static String[] shortUrl(String url) {
        // 对传入网址进行 MD5 加密
        String sMD5EncryptResult = DigestUtils.md5Hex(url);
        System.out.println("---------------sMD5EncryptResult: "+sMD5EncryptResult);
        System.out.println();
        //md5处理后是32位
        String hex = sMD5EncryptResult;
        //切割为4组,每组8个字符, 32 = 4 *  8
        String[] resUrl = new String[4];

        for (int i = 0; i < 4; i++) {
             //取出8位字符串,md5 32位,按照8位一组字符,被切割为4组
            String sTempSubString = hex.substring(i * 8, i * 8 + 8);
            System.out.println("---------------sTempSubString: "+sTempSubString);
           //System.out.println("-sTempSubString作为16进制的表示"+Long.parseLong(sTempSubString, 16));

       //把加密字符按照8位一组16进制与 0x3FFFFFFF 进行位与运算
            // 这里需要使用 long 型来转换,因为 Inteper .parseInt() 只能处理 31 位 , 首位为符号位 , 如果不用 long ,则会越界
            long lHexLong = 0x3FFFFFFF & Long.parseLong(sTempSubString, 16);
            System.out.println("---------lHexLong: "+lHexLong);

            String outChars = "";
            for (int j = 0; j < 6; j++) {
                //0x0000003D它的10进制是61,61代表最上面定义的chars数组长度62的0到61的坐标。
                //0x0000003D & lHexLong进行位与运算,就是格式化为6位,即保证了index绝对是61以内的值
                long index = 0x0000003D & lHexLong;
                System.out.println("----------index: "+index);
                // 按照下标index把从chars数组取得的字符逐个相加
                outChars += chars[(int) index];
                //每次循环按位移5位,因为30位的二进制,分6次循环,即每次右移5位
                lHexLong = lHexLong >> 5;
            }
            // 把字符串存入对应索引的输出数组,会产生一组6位字符串
            resUrl[i] = outChars;
        }
        return resUrl;
    }

2.3 接口设计

设计清晰简单的API接口,包括长链转短链、短链还原成长链等功能。使用RESTful风格可以使接口易于理解和使用。

我们需要两个接口

  • 一个是生成短链接接口

这个接口就是生成短链接,并存放在缓存数据库中。

  • 另一个是重定向到原始的URL

这个接口知识点是重定向,需http状态码的知识

  • 301:永久重定向,浏览器会缓存,自动重定向到新的地址
  • 302:临时重定向,客户端还是会继续使用旧的URL

整个跳转的流程:

  • 1.用户访问短链接,请求到达服务器
  • 2.服务器将短链接装换成为长链接,然后给浏览器返回重定向的状态码301/302
    • 301永久重定向会导致浏览器缓存重定向地址,短链接系统统计访问次数会不正确
    • 302临时重定向可以解决次数不准的问题,但是每次都会到短链接系统转换,服务器压力会变大。
  • 3.浏览器拿到重定向的状态码,以及真正需要访问的地址,重定向到真正的长链接上。

2.4 安全性考虑

        考虑到潜在的滥用和安全威胁,需要实施一些安全机制,例如限制短链接的有效期、监控访问频率等。

        比如如果我们使用redis来存储短链接,我们再放入redis中,同时设置好过期时间。如果使用mysql或者分布式存储HDFS来存储时,可以使用定时任务来清理过期的短链接。

2.5 访问性能优化

        通过合理的缓存机制和负载均衡,保证系统在高并发情况下依然能够快速响应用户请求。

        使用redis存储短链接的数据结构可以使用hash结构来存储短链接到长链接的映射。

        使用布隆过滤器可以防止被人疯狂请求一些不存在的短链接,导致数据库压力过大,甚至垮掉。

        另外在生成短链接时,我们可以使用预生成的短URL,预生成短 URL 的算法可以采用随机数来实现,6 个字符,每个字符都用随机数产生(用0~63 的随机数产生一个 Base64 编码字符)。为了避免随机数产生的短 URL 冲突,需要在预生成的时候检查该 URL 是否已经存在(用布隆过滤器检查)。因为预生成短URL是离线的,所以这时不会有性能方面的问题。并且预生成短 URL可以存储在文件系统中供我们使用。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/214942.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

树_完全二叉树的节点个数

//给你一棵 完全二叉树 的根节点 root &#xff0c;求出该树的节点个数。 // // 完全二叉树 的定义如下&#xff1a;在完全二叉树中&#xff0c;除了最底层节点可能没填满外&#xff0c;其余每层节点数都达到最大值&#xff0c;并且最下面一层的节点都集中在该层最左边的若干位…

Windows下安全认证机制

NTLM&#xff08;NT LAN Manager&#xff09; NTLM协议是在Microsoft环境中使用的一种身份验证协议&#xff0c;它允许用户向服务器证明自己是谁&#xff08;挑战&#xff08;Chalenge&#xff09;/响应&#xff08;Response&#xff09;认证机制&#xff09;&#xff0c;以便…

解密Android动态权限:保护用户隐私与应用安全的关键一步

解密Android动态权限&#xff1a;保护用户隐私与应用安全的关键一步 引言 在Android系统中&#xff0c;权限机制是保护用户隐私和应用安全的重要组成部分。Android应用需要获取一些敏感信息或执行某些敏感操作时&#xff0c;必须先获取相应的权限。例如&#xff0c;应用需要访…

普通策略梯度算法原理及PyTorch实现【VPG】

有没有想过强化学习 (RL) 是如何工作的&#xff1f; 在本文中&#xff0c;我们将从头开始构建最简单的强化学习形式之一 —普通策略梯度&#xff08;VPG&#xff09;算法。 然后&#xff0c;我们将训练它完成著名的 CartPole 挑战 — 学习从左向右移动购物车以平衡杆子。 在此…

正则表达式从放弃到入门(2):grep命令详解

正则表达式从放弃到入门&#xff08;2&#xff09;&#xff1a;grep命令详解 总结 本博文转载自 这是一篇”正则表达式”扫盲贴&#xff0c;如果你还不理解什么是正则表达式&#xff0c;看这篇文章就对了。 如果你是一个新手&#xff0c;请从头阅读这篇文章&#xff0c;如果你…

苹果配件妙控鼠标、键盘、触控板值得入手吗

大家好&#xff0c;我是极智视界&#xff0c;欢迎关注我的公众号&#xff0c;获取我的更多前沿科技分享 邀您加入我的知识星球「极智视界」&#xff0c;星球内有超多好玩的项目实战源码和资源下载&#xff0c;链接&#xff1a;https://t.zsxq.com/0aiNxERDq 苹果的优质和成功绝…

[进程控制]模拟实现命令行解释器shell

文章目录 1.字符串切割函数2.chdir()接口3.模拟实现shell 1.字符串切割函数 2.chdir()接口 3.模拟实现shell 模拟实现的shell下删除: ctrlbackspace模拟实现下table/上下左右箭头无法使用[demo] #include <stdio.h> #include <stdlib.h> #include <string.h&g…

高级开发实战MySQL、Redis、MongoDB 数据库,让你一课掌握核心技能

在现代软件开发中&#xff0c;数据库是不可或缺的一部分。MySQL、Redis和MongoDB作为三种常见的数据库系统&#xff0c;具有各自独特的特点和优势&#xff0c;对于高级开发者来说&#xff0c;掌握这三种数据库的核心技能至关重要。本文将带您通过实战的方式&#xff0c;学习如何…

pybind11教程

pybind11教程 文章目录 pybind11教程1. pybind11简介2. cmake使用pybind11教程3. pybind11的历史 1. pybind11简介 项目的GitHub地址为&#xff1a; pybind11 pybind11 是一个轻量级的头文件库&#xff0c;用于在 Python 和 C 之间进行互操作。它允许 C 代码被 Python 调用&am…

22、为什么是卷积?

(本文已加入“计算机视觉入门与调优”专栏,点击专栏查看更多文章信息) 我们先看一看神经网络(或者叫一个AI模型),是如何完成一张图片的推理的。 你肯定听说过阿尔法狗大战柯洁的故事,当时新闻一出,不知大家什么反应,反正我是被震撼到了。机器竟然学到了那么多的棋谱,…

OpenAI发生的大事件总结!

在 11 月的最后一天&#xff0c;OpenAI 官网发布了一则公告&#xff0c;宣布 Sam Altman 再次担任首席执行官&#xff0c;并成立了新的初始董事会。这项持续了 12 天的事件终于得到了解决&#xff0c;OpenAI 回到了正常运营轨道上。 一切仍然保持不变&#xff1a; Sam Altman仍…

免费分享一套开源SpringCloud支持全套二轮四轮全套源码支持云快充1.5、云快充1.6

文章目录 一、产品功能部分截图1.手机端&#xff08;小程序、安卓、ios&#xff09;2.PC端 二、小程序体验账号以及PC后台体验账号1.小程序体验账号2.PC后台体验账号关注公众号获取最新资讯 三、产品简介&#xff1f;1. 充电桩云平台&#xff08;含硬件充电桩&#xff09;&…

若依框架分页

文章目录 一、分页功能解析1.前端代码分析2.后端代码分析3. LIMIT含义 二、自定义MyPage,多态获取total1.定义MyPage类和对应的调用方法 一、分页功能解析 1.前端代码分析 页面代码 封装的api请求 接口请求 2.后端代码分析 controller代码 - startPage() getDataTable(…

编程中常见的技术难题有哪些?By AI

编程对于现代社会发展的重要性 编程&#xff0c;即按照特定的规则和逻辑&#xff0c;为计算机设计指令的过程&#xff0c;已经深深地融入现代社会的各个角落。它对人们的生活、工作和科技发展产生了深远的影响。 首先&#xff0c;编程改变了人们的生活方式。如今&#xff0c;…

力扣 --- 最后一个单词的长度

题目描述&#xff1a; 给你一个字符串 s&#xff0c;由若干单词组成&#xff0c;单词前后用一些空格字符隔开。返回字符串中 最后一个 单词的长度。 单词 是指仅由字母组成、不包含任何空格字符的最大子字符串。 示例 1&#xff1a; 输入&#xff1a;s "Hello World&…

van-list的onload事件多次触发的问题

一、问题描述 如图所示&#xff0c;页面刷新的时候&#xff0c;调了3次接口&#xff08;总共27条数据&#xff0c;我分页10条&#xff09;&#xff0c;一直莫名奇妙的 我期望是默认加载第一页&#xff0c;然后我上拉的时候再push第二页的数据 二、解决方法 还是要多看文档 1…

非标设计之气缸概述

气缸的组成&#xff1a; 气缸的分类 单作用气缸&#xff1a; 活塞仅一侧供气&#xff0c;气压推动活塞产生推力伸出&#xff0c;靠弹簧或自重返回。 双作用气缸&#xff1a; 气缸活塞两侧都有气压力&#xff0c;来实现前进或后退动作。 气缸的缓冲 但是&#xff0c;气缸也…

基于Java SSM框架+Vue实现疫情期间医院门诊网站项目【项目源码+论文说明】

基于java的SSM框架Vue实现疫情期间医院门诊网站演示 摘要 21世纪的到来&#xff0c;国家的方方面面、各行各业都在努力与现代的先进技术接轨&#xff0c;智能科技时代崛起的优势&#xff0c;医院门诊管理系统当然也不能排除在外。疫情期间医院门诊管理系统是以实际运用为开发背…

WPF图像处理之像素操作

文章目录 框架准备图像转灰度像素操作 WPF Image控件的初步使用 框架准备 为了演示C#中的图像处理功能&#xff0c;先在xaml中导入一张图片&#xff0c;并且预留出一个WrapPanel&#xff0c;用于存放操作按钮。 <TabControl TabStripPlacement"Left"><Ta…

前后端数据传输格式(下)

作者简介&#xff1a;大家好&#xff0c;我是smart哥&#xff0c;前中兴通讯、美团架构师&#xff0c;现某互联网公司CTO 联系qq&#xff1a;184480602&#xff0c;加我进群&#xff0c;大家一起学习&#xff0c;一起进步&#xff0c;一起对抗互联网寒冬 上篇主要复习了HTTP以及…