数据库管理-第258期 23ai:Oracle Data Redaction(20241104)

数据库管理258期 2024-11-04

  • 数据库管理-第258期 23ai:Oracle Data Redaction(20241104)
    • 1 简介
    • 2 应用场景与有点
    • 3 多租户环境
    • 4 特性与能力
      • 4.1 全数据编校
      • 4.2 部分编校
      • 4.3 正则表达式编校
      • 4.4 随机编校
      • 4.5 空值编校
      • 4.6 无编校
      • 4.7 不同数据类型上不同类型校验的对比
    • 总结

数据库管理-第258期 23ai:Oracle Data Redaction(20241104)

作者:胖头鱼的鱼缸(尹海文)
Oracle ACE Pro: Database(Oracle与MySQL)
PostgreSQL ACE Partner
10年数据库行业经验,现主要从事数据库服务工作
拥有OCM 11g/12c/19c、MySQL 8.0 OCP、Exadata、CDP等认证
墨天轮MVP、年度墨力之星,ITPUB认证专家、专家百人团成员,数盟会长老会成员,OCM讲师,PolarDB开源社区技术顾问,HaloDB外聘技术顾问,OceanBase观察团成员,青学会MOP技术社区(青年数据库学习互助会)技术顾问
圈内拥有“总监”、“保安”、“国产数据库最大敌人”等称号,非著名社恐(社交恐怖分子)
公众号:胖头鱼的鱼缸;CSDN:胖头鱼的鱼缸(尹海文);墨天轮:胖头鱼的鱼缸;ITPUB:yhw1809。
除授权转载并标明出处外,均为“非法”抄袭

在这里插入图片描述

上周在整理Oracle DB 23.6新特性的时候,看到了一个不那么熟悉的特性,即本篇介绍的Oracle Data Redaction。本篇针对Oracle DB 23ai版本。

1 简介

Oracle Data Redaction,可以译作Oracle数据编校,能够隐藏查询返回的数据,而不会直接影响数据。这是通过在呈现结果之前对数据库查询的结果进行编校(有选择地删除或隐藏敏感或机密信息)来实现的。可以将数据编校策略应用于表、视图或物化视图。然后,将表上的策略应用于表中的特定列。
可以使用以下方法之一来编校列数据:

  • Full redaction。全编校,编校了列数据的所有内容。返回给查询用户的编校值取决于列的数据类型和完整编校值的设置。默认情况下,NUMBER数据类型的列用零(0)编校,字符数据类型用单个空格编校。但是,这些值可以使用UPDATE_FULL_REDACTION_VALUES进行更改。
  • Partial redaction。部分编校,编校列数据的一部分。例如,您可以用星号(*)编校社会保障号码,但最后4位数字除外。
  • Regular expressions。正则表达式,可以使用正则表达式来查找要编校的数据模式。例如,您可以使用正则表达式来编校电子邮件地址,这些地址可以有不同的字符长度。它仅设计用于字符数据。
  • Random redaction。随机编校,根据列的数据类型,每次显示时,呈现给查询用户的编校数据都会显示为随机生成的值。
  • Nullify redation。空值编校,编校列中的所有数据,并将其替换为null值。
  • No redaction。无编校类型选项使您能够测试编校策略的内部操作,而不会影响对定义了策略的表的查询结果。可以使用此选项在将编校策略定义应用于生产环境之前对其进行测试。

数据编校对最终用户是透明的,因为它保留了原始数据类型和(可选)格式。它对数据库是透明的,因为数据在缓冲区、缓存和存储中保持不变,只在SQL查询结果返回给调用者之前的最后一刻发生变化。使用编校策略访问表或视图的所有查询都会一致地执行编校。可以通过检查通过SYS_CONTEXT函数传递到数据库中的用户信息来指定哪些用户应该只看到经过编校的数据;您可以根据当前数据库的属性编校数据;您可以在给定的编校策略中实现多个逻辑条件。此外,数据编校的实现方式最大限度地降低了性能开销。这些特性使Oracle数据编校特别适合共享通用生产数据库的一系列应用程序、分析工具、报告工具和监控工具使用。
Oracle数据库在用户访问数据时(即在查询执行时)在运行时应用编校。该解决方案在生产系统中运行良好。在数据编校间,所有数据处理都正常执行,后端引用完整性约束也得到了保留。
数据编校可以根据需要限制对持卡人数据或个人身份信息的访问,从而帮助您遵守行业、政府和组织的要求。

2 应用场景与有点

与Data Masking不同,数据屏蔽通过用虚构但真实的数据永久替换敏感数据来屏蔽敏感数据,数据编校在从数据库接收数据时对其进行编校,使数据库中的数据保持不变。数据编校使能够使用多种不同的编校样式轻松伪装数据。
Oracle数据编校特别适用于呼叫中心应用程序、即席报告和分析工作负载,在这些工作负载中,数据仅以只读格式提供给最终用户。但是,在将Oracle数据编校与执行数据库更新的应用程序一起使用时要小心,因为编校后的数据可以写回此数据库。
当您使用Oracle数据编校来保护数据时,它提供了几个好处:

  • 在运行时应用编校,对底层数据或存储要求没有影响
  • 运行时对性能影响很小或没有影响
  • 不需要更改应用程序
  • 使您能够通过PL/SQL API或使用Oracle Enterprise Manager用户WEB界面指定和管理数据重做策略
  • 既可用于本地数据库,也可用于云数据库

3 多租户环境

Oracle数据编校策略在PDB级别创建和应用,并且仅适用于该PDB中的对象。无法在CDB根目录中创建编校策略。
您无法为多租户容器数据库(CDB)创建数据重做策略;您只能在PDB级别创建数据重设策略。这是因为为其创建数据编校策略的对象通常位于PDB中。

4 特性与能力

使用DBMS_REDACT包创建并启用数据编校策略,指定编校策略的SCHEMA、对象(Object)和列(Column)。

  • SCHEMA级别指定了指定需要被编校对象的一列或多列的确切SCHEMA。
  • Object级别包括应用Orace数据编校作策略的表、视图和物化视图。每个对象最多可以应用一个策略。
  • Column级别包括编校功能的操作位置。创建编校策略时,可以在一列上定义编校函数。然后,如果需要,您可以编校策略,使用不同的功能编校对象中的其他列。

下面是一个在HR.EMPLOYEES表中SALARY列的数据编校策略的示例:

BEGIN
 DBMS_REDACT.ADD_POLICY(
   object_schema       => 'hr', 
   object_name         => 'employees', 
   column_name         => 'salary',
   policy_name         => 'hr_emp_redact_comp_pol', 
   function_type       => DBMS_REDACT.FULL,
   expression          => '1=1');
END;

在该示例中,使用DBMS_REDACT包中的ADD_POLICY过程来定义一个名为hr_emp_redact_comp_pol的Oracle数据编校策略。函数类型DBMS_REDACT.FULL指定对薪资列中的检索值时执行所有的数据编校,这意味着默认情况下,数字数据类型在输出文本中替换为零(0)。表达式参数设置策略,以便在计算结果为TRUE (1=1)时执行编校。

4.1 全数据编校

全数据编校对表或视图的指定列的全部内容进行编校。
默认情况下,输出显示如下:

  • 字符数据类型:输出为单个空格。
  • 数字数据类型:输出为零(0)。
  • 日期时间数据类型:输出设置为2001年1月的第一天,显示为01-JAN-2001。

在执行DBMS_REDACT.ADD_POLICY过程时通过设置function_type来指定全编校:

function_type    => DBMS_REDACT.FULL

全编校是默认设置,只要数据编校策略指定了列但省略了function_type参数设置,就会使用全编校。
可以使用DBMS_REDACT.UPDATE_FULL_REDACION_VALUES过程,将完整的编校输出更改为不同的值。您可以通过查询REDACTION_VALUES_FOR_TYPE_FULL数据字典视图来查找当前值。

4.2 部分编校

在部分数据编校中,可以编校显示输出的部分内容。
可以设置实际数据中开始编校的位置、从该位置开始编校的字符数以及要使用的编校字符。(实际数据是受保护的表或视图中的数据。实际数据的一个示例可能是数字123456789,此数字的编校数据版本可能是999996789。)这种类型的编校对于希望查看数据的人明显看到它以某种方式被编校的情况非常有用。通常,您会对信用卡号码或身份证号码使用这种类型的编校。
请注意,部分数据编校要求您的数据宽度保持固定。如果要对包含可变长度字符串值的列进行编校,则必须使用正则表达式编校。
要指定部分编校,必须设置DBMS_REDACT.ADD_POLICY或DBMS_REDACT.ALTER_POLICY过程function_type参数到DBMS_REDACT.PARTIAL,并使用function_parameters参数定义部分编校行为。
部分数据编校的显示输出如下:

  • 字符数据类型:当部分编校时,可以编校值为987-65-4320的社会保障号码(表示为字符数据类型中的连字符字符串),使其显示如以下示例所示。右侧的代码指定了如何编校字符数据:它指定了实际数据的预期输入格式、用于显示编校输出的格式、用于编校的字符、开始编校的起始位置以及要编校的字符数。第一个示例对字符数据类型社会保障号码使用预定义的格式(在以前的版本中称为快捷方式),第二个示例将前五个数字替换为星号(*),同时保留数字之间的连字符(-)。
    • function_parameters => DBMS_REDACT.REDACT_US_SSN_F5 的结果为 XXX-XX-4320
    • function_parameters => ‘VVVFVVFVVVV,VVV-VV-VVVV,*,1,5’ 的结果为 ****-**-4320
      在这些示例中,V描述了每个可能被编校的字符,F描述了每个要使用格式化字符格式化的字符。
  • 数字数据类型:部分编校的数字数据类型显示,一些数字被指定字符替换。例如,存储为987654321的社会安全号码可能显示如下。两者都对前五位数字进行了编校。第一个示例使用为NUMBER数据类型中的社会保障号码设计的预定义格式,第二个示例从第一个数字开始用数字9替换前五个数字。
    • function_parameters => DBMS_REDACT.REDACT_NUM_US_SSN_F5 的结果为 XXXXX4321
    • function_parameters => ‘9,1,5’ 的结果为 999994321
  • 日期时间数据类型:部分编校的日期时间值可以简单地显示为不同的日期。例如,日期 29-AUG-11 10.20.50.000000 AM 可能显示如下。在第一个示例中,一个月中的某一天被编校为02(使用设置d02),在第二个示例中该月被编校为DEC(使用m12)。大写值显示实际日期(D)、实际月份(M)、实际年份(Y)、实际小时(H)、实际分钟(M)和实际秒(S)。
    • function_parameters => ‘Md02YHMS’ 的结果为 02-AUG-11 10.20.50.000000 AM
    • function_parameters => ‘m12DYHMS’ 的结果为 29-DEC-11 10.20.50.000000 AM

4.3 正则表达式编校

正则表达式根据模式搜索编校列数据值中的特定数据。您可以使用正则表达式来编校不同长度的字符串列。
例如,您可以编校电子邮件地址的用户名,以便只显示域(例如,替换电子邮件地址中的hprestonhpreston@example.com使用[redacted],使其显示为[redacte]@example.com)。要执行编校,请设置DBMS_REDACT.ADD_POLICY或DBMS_REDACT.ALTER_POLICY过程function_type参数到DBMS_REDACT.REGEXP或DBMS_REDACT.REGEXP_WIDTH,然后使用以下参数构建正则表达式:

  • 字符串搜索模式(即要搜索的值),例如:
regexp_pattern => '(.+)@(.+\.[A-Za-z]{2,4})' 

此设置查找以下形式的模式:

one_or_more_characters@one_or_more_characters.2-4_characters_in_range_A-Z_or_a-z
  • 替换字符串,用于替换与regexp_pattern设置匹配的值。替换字符串可以包含对主正则表达式模式的子表达式的反向引用。以下示例将@符号之前的数据(来自regexp_pattern设置)替换为文本[redacted]。\2设置是指regexp_pattern设置中的第二个匹配组,即(.+.[A-Za-z]{2,4})。
regexp_replace_string => '[redacted]@\2'
  • 字符串搜索字符串的起始位置,例如数据的第一个字符,例如:
regexp_position => DBMS_REDACT.RE_BEGINNING

如果未指定,则此值为默认值。

  • 要执行的搜索和替换操作的类型,例如第一次出现、每五次出现或所有出现,例如:
regexp_occurrence => DBMS_REDACT.RE_ALL

如果未指定,则此值为默认值。

  • 搜索和替换操作的默认匹配行为,例如搜索是否区分大小写(i将其设置为不区分大小写):
regexp_match_parameter => 'i'

除了默认参数外,您还可以使用一组预定义的格式,使您能够对电话号码、电子邮件地址和信用卡号码使用常用的正则表达式。

4.4 随机编校

在随机数据编校中,通过将其替换为随机值来编校整个值。
每次应用程序用户运行查询时,查询结果集中显示的编辑值都会随机更改。
这种类型的编校在您不希望数据被明显编校的情况下很有用。它尤其适用于数字和日期时间数据类型,在这些数据类型中很难区分随机数据和真实数据。
随机值的显示输出会根据编校列的数据类型而变化,如下所示:

  • 字符数据类型:随机输出是字符的混合(例如,HTU[G{\pjkEWcK)。它对CHAR和VARCHAR2数据类型的行为不同,如下所示:
    • CHAR数据类型:编校后的输出始终与列的字符集位于同一字符集中。编校输出的字节长度始终与列定义长度相同(即,在创建表时提供的列长度)。例如,如果列是CHAR(20),则在用户查询的编校输出中提供20个随机字符的字符串。
    • VARCHAR2数据类型:对于VARCHAR数据类型的随机编校,编校后的输出始终与列的字符集位于同一字符集中。根据列中实际数据的长度,编校输出的长度是有限的。不显示超过实际数据长度的字符。例如,如果列是VARCHAR2(20),并且被编校的行包含长度为12的实际数据,则用户对该行的查询的编校输出中会提供一个由12个随机字符(不是20个)组成的字符串。
  • 数字数据类型:每个实际数值都会被修改为随机的非负数。这种编校产生的随机数不会超过实际数据的精度。例如,可以通过将数字987654321替换为数字12345678、13579、0或987654320中的任何一个来编校它,但不能将其替换为数字98765432 1、99987654321或-1中的任何数字。数字-123可以通过用数字122、0或83替换它来编校,但不能用数字123、1123或-2中的任何一个替换它。
    上述情况的唯一例外是实际值是-1到9之间的整数。在这种情况下,通过将实际数据替换为模为十(10)的随机非负整数来对其进行编校。
  • 日期时间数据类型:当使用随机数据编校操作对日期数据类型的值进行编校时,Oracle数据库会使用始终与实际数据不同的随机日期显示它们。
    通过下面配置实现随机编校:
function_type => DBMS_REDACT.RANDOM

4.5 空值编校

您可以创建Oracle数据编校策略,通过在查询结果中仅显示空值来编校列数据。
此功能使您能够使用DBMS_REDACT.NULLIFY函数用于隐藏表或视图列中的所有敏感数据,并将其替换为空值。您可以使用DBMS_REDACT的function_type参数设置此函数DBMS_REDACT.ADD_POLICY或DBMS_REDACT.ALTER_POLICY程序。

function_type => DBMS_REDACT.NULLIFY

4.6 无编校

可以创建不执行编校的数据编校策略。这使您能够在测试期间在应用程序中包含编校策略,然后在将应用程序移至生产环境时将这些策略应用于数据。
这对于您有一个经过编校的基表,但希望特定应用程序用户拥有一个始终显示实际数据的视图的情况非常有用。默认情况下,在已编校表上创建的视图将使用与基表相同的策略进行编校。但是,您可以为视图定义单独的编校策略。您可以创建已编校表的新视图,然后为此视图定义数据编校策略。当应用程序查询视图时,将应用在视图上定义的策略。该策略仍然存在于基表上,但只要DBMS_REDACT.NONE function_type设置用于在视图上创建策略,当应用程序使用视图进行查询时,就不会执行任何编校。

4.7 不同数据类型上不同类型校验的对比

这里可以通过以下网址中的列表进行查看:

https://docs.oracle.com/en/database/oracle/oracle-database/23/dbred/comparison-full_-partial_-and-random-redaction-based-data-types.html

总结

本期简单介绍了下Oracle数据编校,后面将在Oracle 23ai Free版本中进行实际测试。
老规矩,知道写了些啥。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/911124.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Kettle——CSV文件转换成excel文件输出

1.点击—文件—新建—转换 拖入两个组件: 按shift+鼠标左击建立连接,并点击主输出步骤, 点击CSV文件输入,选择浏览的csv文件,然后点击确定 同样,Excel也同上,只是要删除这个xls 并…

【数据集】【YOLO】【目标检测】火情、烟雾、火灾检测数据集 9848 张,YOLO火灾检测算法实战训练教程!

数据集介绍 【数据集】火情、烟火、火灾检测数据集 9848 张,目标检测,包含YOLO/VOC格式标注。 数据集中包含2种分类:{0: Fire, 1: Smoke},分别是‘火焰’和‘烟雾’。 数据集来自国内外图片网站和视频截图; 可用于…

Python酷库之旅-第三方库Pandas(202)

目录 一、用法精讲 941、pandas.CategoricalIndex.set_categories方法 941-1、语法 941-2、参数 941-3、功能 941-4、返回值 941-5、说明 941-6、用法 941-6-1、数据准备 941-6-2、代码示例 941-6-3、结果输出 942、pandas.CategoricalIndex.as_ordered方法 942-1…

docker 拉取MySQL8.0镜像以及安装

目录 一、docker安装MySQL镜像 搜索images 拉取MySQL镜像 二、数据挂载 在/root/mysql/conf中创建 *.cnf 文件 创建容器,将数据,日志,配置文件映射到本机 检查MySQL是否启动成功: 三、DBeaver数据库连接 问题一、Public Key Retrieval is not allowed 问题…

Java多线程详解⑤(全程干货!!!)线程安全问题 || 锁 || synchronized

这里是Themberfue 在上一节的最后,我们讨论两个线程同时对一个变量累加所产生的现象 在这一节中,我们将更加详细地解释这个现象背后发生的原因以及该如何解决这样类似的现象 线程安全问题 public class Demo15 {private static int count 0;public …

如何使用RabbitMQ和Python实现广播消息

使用 RabbitMQ 和 Python 实现广播消息的过程涉及设置一个消息队列和多个消费者,以便接收相同的消息。RabbitMQ 的 “fanout” 交换机允许你将消息广播到所有绑定的队列。以下是如何实现这一过程的详细步骤。 1、问题背景 在将系统从Morbid迁移到RabbitMQ时&#x…

【RabbitMQ】04-发送者可靠性

1. 生产者重试机制 spring:rabbitmq:connection-timeout: 1s # 设置MQ的连接超时时间template:retry:enabled: true # 开启超时重试机制initial-interval: 1000ms # 失败后的初始等待时间multiplier: 1 # 失败后下次的等待时长倍数,下次等待时长 initial-interval…

java的类加载机制的学习

一、类加载的过程 一个类被加载到虚拟机内存中开始,到卸载出虚拟机内存为止,整个生命周期分为七个阶段,分别是加载、验证、准备、解析、初始化、使用和卸载。其中验证、准备和解析这三个阶段统称为连接。 除去使用和卸载,就是Ja…

uni-app跨域set-cookie

set-cookie的值是作为一个权限控制的 首先,无论什么接口都会返回一个set-cookie,但未登录时,set-cookie是没有任何权限的 其次,登录接口请求时会修改set-cookie,并且在后续其他接口发起请求时,会在请求头…

让智能体—“正念365”陪你一起“养心”

佛学的“八正道”中,笔者个人观点,“正念”是最适合当代人低门槛练习的一个,因为不需要阅读大量的知识来理解概念,只需要保持对当下的觉察,发现分心了,就不带评价的把注意力拉回到当前的事情上就好。就是佛…

浅析Android Handler机制实现原理

0. 背景描述 Android系统出于对简单、高效的考虑,在设计UI体系时采用了单线程模型,即不会在多个线程中对同一个UI界面执行操作。简单是指单线程模型可以不用考虑和处理在多线程环境下操作UI带来的线程安全问题,高效是指单线程模型下无需通过…

vue 3:监听器

目录 1. 基本概念 2. 侦听数据源类型 1. 监听getter函数 2. 监听 ref 或 reactive 的引用 3. 多个来源组成的数组 4. 避免直接传递值!!! 3. 深层侦听器 4. 立即回调的侦听器 5. 一次性侦听器 6. watchEffect() 7. 暂停、恢复和停止…

沉浸式学习新体验:3D虚拟展厅如何重塑教育格局!

3D虚拟展厅对于教育行业产生了深远的影响,主要体现在以下几个方面: 一、创新教学方式 3D虚拟展厅利用三维技术构建的虚拟展示空间,为教育行业带来了一种全新的教学方式。传统的教学方式往往局限于书本和课堂,而3D虚拟展厅则能够…

【Kafka】Windows+KRaft部署指南

【Kafka】WindowsKRaft部署指南 摘要本地环境说明官网快速开始修改config/kraft/server.properties初始化数据存储目录启动 测试创建topic创建生产者创建消费者 FAQ输入行太长。命令语法不正确。问题描述解决方案 参考资料 摘要 Kafka是一种高吞吐量的分布式发布订阅消息系统&…

面相小白的php反序列化漏洞原理剖析

前言 欢迎来到我的博客 个人主页:北岭敲键盘的荒漠猫-CSDN博客 本文整理反序列化漏洞的一些成因原理 建议学习反序列化之前 先对php基础语法与面向对象有个大体的了解 (我觉得我整理的比较细致,了解这俩是个啥就行) 漏洞实战情况 这个漏洞黑盒几乎不会被发现&am…

景联文科技专业数据标注公司:高质量数据标注推动AI产业发展

在当今数据驱动的时代,高质量的数据标注对于机器学习、自然语言处理(NLP)和计算机视觉等技术领域的发展起着至关重要的作用。 数据标注是指对原始数据进行处理,标记对象的特征,生成满足机器学习训练要求的可读数据编码…

yelp数据集上识别潜在的热门商家

yelp数据集是研究B2C业态的一个很好的数据集,要识别潜在的热门商家是一个多维度的分析过程,涉及用户行为、商家特征和社区结构等多个因素。从yelp数据集里我们可以挖掘到下面信息有助于识别热门商家 用户评分和评论分析 评分均值: 商家的平均评分是反映其…

YOLO11改进 | 融合改进 | C3k2融合ContextGuided 【独家改进, 两种方式】

秋招面试专栏推荐 :深度学习算法工程师面试问题总结【百面算法工程师】——点击即可跳转 💡💡💡本专栏所有程序均经过测试,可成功执行💡💡💡 本文给大家带来的教程是将YOLO11的C3k2替…

【harbor】离线安装2.9.0-arm64架构服务制作和升级部署

harbor官网地址:Harbor 参考文档可以看这里:部署 harbor 2.10.1 arm64 - 简书。 前提环境准备: 安装docker 和 docker-compose 先拉arm64架构的harbor相关镜像 docker pull --platformlinux/arm64 ghcr.io/octohelm/harbor/harbor-regist…

InfluxDB 2 关闭pprof

背景: Go 语言的 net/http/pprgf包如未配置正确暴露在公网容易引起敏感信息泄漏问题,导致源码等信息泄漏。 influxdb 2 默认是开启pprof的 使用 localhost:8086/debug/pprof/goroutine?debug1 可以看到接口暴露的信息 如何关闭pprof 官方文档&…