数据脱敏学习

数据脱敏是一种保护敏感信息的方法,它通过修改或删除数据中的敏感部分,使得数据在保持一定可用性的同时,不再直接关联到个人隐私或重要信息。

然人指可以直接或间接标识

  • 直接标识:如姓名、身份证号码、家庭住址、电话号码、电子邮件地址、护照号码、社会安全号码(或等效物)、驾驶执照号码等。    
  • 间接标识:如位置数据、在线身份识别(如IP地址)、Cookie、DNA样本、指纹等。
  • 其他因素:与个人的物理、生理、遗传、心理、经济、文化或社会身份相关的特定因素。

数据脱敏通常用于以下场景

  • 测试和开发:在开发和测试环境中使用脱敏数据,可以避免使用真实数据带来的风险。
  • 数据共享:在数据共享或数据交换时,使用脱敏数据可以保护个人隐私。
  • 数据分析:在进行数据分析时,使用脱敏数据可以保护数据的原始性不被泄露。

常见的数据脱敏技术

  • 替换法:将真实数据替换为虚假但结构相似的数据。例如,将真实姓名替换为随机生成的假名。

  • 加密法:使用加密算法对敏感数据进行加密,只有拥有密钥的用户才能解密看到原始数据。

  • 扰动法:在原始数据中加入一定的随机噪声,使得数据仍然保持统计特性,但具体数值已被改变。

  • 泛化法:将具体数据泛化为更一般的形式。例如,将具体的年龄泛化为年龄段,将具体地址泛化为城市或区域。

  • 删除法:直接删除数据中的敏感部分,这种方法简单直接,但可能会损失部分数据价值。

  • 标记化:用唯一的标记替换敏感数据,这些标记不包含原始数据的任何信息,但可以用于后续的数据处理和分析。

数据脱敏工具

  • Desensitization :这是一个基于Python的库,提供了一系列丰富的数据脱敏策略,包括替换、掩码和加密等。它旨在简化数据处理流程,使得开发人员能够快速集成到现有的数据管理系统中。
  • Hutool :Hutool是一个Java基础工具类库,提供了一行代码实现数据脱敏的功能,支持对手机号、银行卡号、身份证号和密码等敏感信息进行脱敏处理。
  • Apache ShardingSphere :这是一个分布式数据库中间件,提供了自动化和透明化的数据脱敏过程,用户无需关注数据脱敏的实现细节。
  • 腾讯云DMask :这是一款敏感数据脱敏与水印标记工具,用于对数据系统中的敏感信息进行脱敏处理,并在数据泄漏时提供追溯依据。
  • SensitiveBye :这是一款专注于数据脱敏的Java工具包,支持对接口字段、Java对象字段和JSON序列化字段进行脱敏,也支持常见日志框架的输出内容脱敏。
  • deidentify :这是一个基于Python的数据脱敏工具,支持对结构化和非结构化数据进行脱敏处理,提供了多种脱敏技术,如替换、加密和随机化等。
  • IBM InfoSphere Optim Data Privacy Solution:这是一个企业级的数据脱敏解决方案,它提供了多种脱敏技术,包括数据替换、加密和泛化等,适用于大型企业和复杂的数据环境。
  • Oracle Data Masking and Subsetting Pack:这是Oracle提供的一个工具,它允许用户对数据库中的敏感数据进行脱敏,同时保留数据的结构和关系,确保脱敏后的数据仍然适用于测试和开发环境。
  • Camouflage:Camouflage是一个专业的数据脱敏工具,它支持多种数据库和文件格式,提供了灵活的脱敏策略和方法,适用于各种规模的企业。
  • Delphix:Delphix不仅提供数据脱敏功能,还包括数据虚拟化和数据版本控制等功能。它可以帮助企业快速创建和管理脱敏后的数据副本,用于非生产环境。
  • Compuware Optimal DataMasking:这个工具专注于提供高效的数据脱敏解决方案,支持多种数据库系统,并提供了易于使用的界面和强大的脱敏功能。
  • DataSunrise Data Masking:DataSunrise提供了一个集成的数据脱敏模块,可以实时对敏感数据进行脱敏,适用于需要实时数据保护的场景。




本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/752939.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

生命在于折腾——Macbook虚拟机开启360核晶

首先启动PD虚拟机,打开360,发现提示如下: 此时将虚拟机关机。 打开该虚拟机设置: 将虚拟机监控程序改为Parallels,并启动nested虚拟化。 改好后截图如下: 保存设置,开机 此时就可以开启了…

手机恢复已删除数据,3种情况下的解决办法,史诗级教程

手机已经变成了我们生活中的“黑匣子”,记录着我们的通讯录、照片、视频、聊天记录等各种重要数据。然而,由于误删、系统崩溃或其他不可预测的情况,我们可能会面临数据丢失的风险。 本文将为你提供一份史诗级的教程,详细介绍3种不…

10种超强图像特征提取算法Python代码实现

声明:文章是从本人公众号中复制而来,因此,想最新最快了解各类算法的家人,可关注我的VX公众号:python算法小当家,不定期会有很多免费代码分享~ 图像特征提取是计算机视觉和图像处理的关键步骤,因…

零基础STM32单片机编程入门(四)ADC详解及实战含源码视频

文章目录 一.概要二.STM32F103C8T6单片机ADC外设特点三.STM32单片机ADC内部结构图1.ADC相关引脚说明2.ADC通道分类3.触发源4.转换周期5.电压转换计算6.更精确电压转换计算 四.规则通道ADC采集信号流向1.单次转换模式2.连续转换模式 五.CubeMX配置一个ADC采集例程六.CubeMX工程源…

Nginx反向代理实现Vue跨域注意事项

1、通过搜索引擎访问Nginx官网——免费使用——NGINX开源版(免费下载)或者通过以下链接直接访问Nginx下载页面下载对应的版本(下载页面)。以下以1.24.0为例 2、修改nginx的配置文件,在conf文件夹下,文件名为nginx.conf;以下是我修改完的配置…

【Python数据分析与可视化】:使用【Matplotlib】实现销售数据的全面分析 ——【Matplotlib】数模学习

目录 安装Matplotlib 1.打开PyCharm: 2.打开终端: 3.安装Matplotlib: 4.确认安装: 导入Matplotlib 创建简单的折线图 代码解析: 创建子图 代码解析: 创建柱状图 代码解析: 创建散点…

总结一下Linux、Windows、Ubuntu、Debian、CentOS等到底是啥?及它们的区别是什么

小朋友你总是有很多问好 你是否跟我一样,不是计算机科班出身,很多东西都是拿着在用,并不知道为什么,或者对于它们的概念也是稀里糊涂的,比如今天说的这个。先简单描述下,我先前的疑问: Linux是…

《昇思25天学习打卡营第9天 | 昇思MindSpore使用静态图加速》

第九天 本节了解到AI编译框架分为两种运行模式,分别是动态图模式以及静态图模式。MindSpore默认情况下是以动态图模式运行,但也支持手工切换为静态图模式。 1.动态图模式 动态图的特点是计算图的构建和计算同时发生(Define by run&#xff09…

Studying-代码随想录训练营day23| 39.组合总和、40.组合总和II、131.分割回文串

第23天,回溯part02,回溯两个题型组合,切割(ง •_•)ง💪 目录 39.组合总和 40.组合总和II 131.分割回文串 总结 39.组合总和 文档讲解:代码随想录组合总和 视频讲解:手撕组合总和 题目:…

一文汇总VSCode多光标用法

光标的创建 按住alt,鼠标左键单击,在单击位置生成光标/删除光标 按住ctrlalt,单击↑/↓,在每行同一个位置(若某一行较短,则在行尾)生成光标,这个不会删除光标,只会在光标…

点击获取2024SIAL西雅国际食品展上海展后报告

随着2024年SIAL 西雅展(上海)的圆满落幕,我们不仅见证了一场食品与饮料行业的国际盛会,更是感受到了上海这座城市独有的魅力与活力。在这里,我们回顾了上海展的辉煌成就,同时,我们也满怀期待地展…

基于横纵向的混合联邦学习原理分析

近期陆续接触到关于混合联邦学习的概念,但基于横纵向的混合联邦实际的应用案例却几乎没有看到,普遍是一些实验性的课题,因此这一领域知识没有被很好普及。本篇文章的目的,主要是分析讨论关于横纵向混合联邦学习的业务场景、应用架…

Linux Redis 服务设置开机自启动

文章目录 前言一、准备工作二、操作步骤2.1 修改redis.conf文件2.2 创建启动脚本2.3 设置redis 脚本权限2.4 设置开机启动2.5 验证 总结 前言 请各大网友尊重本人原创知识分享,谨记本人博客:南国以南i、 提示:以下是本篇文章正文内容&#x…

【Electron】Electron入门实现

Electron 学习笔记 Electron 是一个开源框架,允许开发者使用网页技术(HTML、CSS 和 JavaScript)来构建跨平台的桌面应用程序。它由 GitHub 开发并维护,最初是为了支持开发 Atom 编辑器。Electron 结合了 Chromium(用于…

海外仓一件代发业务优化指南:成本构成分析及优化策略

一件代发是大部分海外仓的核心业务,不过随着海外仓市场竞争的加剧,仓库经营成本上涨成了普遍现象。 今天我们会结合众多海外仓的实际情况,综合分析海外仓一件代发业务成本的构成,成本激增的原因以及对应的优化策略,希…

仓库选址问题【数学规划的应用(含代码)】阿里达院MindOpt

本文主要讲述使用MindOpt工具优化仓库选址的数学规划问题。 视频讲解👈👈👈👈👈👈👈👈👈 一、案例场景 仓库选址问题在现代物流和供应链管理中具有重要的应用。因为仓库…

findfont: Generic family ‘sans-serif‘ not found because none of the ...: SimHei

警告过程 python代码在使用matplotlib画图时,如果在title,xlabel,ylabel中出现了中文,则会出现字体警告,中文字符显示为方框 例如代码: # matplotlib画图# 设置色带plt.imshow(data, cmapplt.cm.YlGn) #…

【AI大模型】应用开发基础,学到就是赚到!

前言 1、了解大模型能做什么 2、整体了解大模型应用开发技术栈 3、浅尝OpenAI API的调用 AI全栈工程师:懂AI、懂编程、懂业务的超级个体,会是AGI(Artificial General Intelligence 通用人工智能)时代最重要的人。 知识体系 AI学习…

【Mybatis 与 Spring】事务相关汇总

之前分享的几篇文章可以一起看,形成一个体系 【Mybatis】一级缓存与二级缓存源码分析与自定义二级缓存 【Spring】Spring事务相关源码分析 【Mybatis】Mybatis数据源与事务源码分析 Spring与Mybaitis融合 SpringManagedTransaction: org.mybatis.spri…

Ubuntu/Linux调试安装南京来可CAN卡

准备好USB rules文件和can driver文件备用! 必做:放置USB rules文件到对应位置处理权限问题 而后:安装内核driver并编译。需求众多依赖编译环境,视情况安装填补。如GCC,G,make等等 进入对应64bit文件夹中,添加权限,执…