数据库血缘工具学习,使用以及分享

一.血缘关系是什么?为什么要分析血缘关系?

首先,什么是血缘关系?
是指在数据的全生命周期中,从数据的产生、处理、加工、融合、流转到最终消亡,数据之间自然形成的一种类似人类血缘的关联关系。

说的再简单直白一点就是我们的表是由哪些表分析得出的。

血缘关系有四大特性:归属性、多源性、可追溯及层次性

归属性:一般来说,特定的数据归属于特定的组织或者个人。

多源性:同一个数据可以有多个来源(多个父亲);一个数据也可以是多个数据经过加工生成的,而且这种加工过程可以是多个。

可追溯性:数据的血缘关系体现了数据的生命周期,体现了数据从产生到消亡的整个过程,具备可追溯性。

层次性:数据的血缘关系是有层次的。对数据进行分类、归纳、总结等描述信息又会形成新的数据,不同程度的描述信息形成了数据的层次。

数据血缘产生最本质的需求。大数据开发作为数据汇集与数据服务提供方,庞大的数据与混乱的数据依赖导致管理成本与使用成本飙升。

而在我的数仓文章中:
离线数仓项目实战!其二导入数据与数据仓库维度建模_离线数仓互联网金融项目-CSDN博客
离线数仓项目实战!其三项目剩下的维度建模、任务调度与datagear可视化分析-CSDN博客
我对数仓中的表进行血缘分析时是用Excel逐一对比的,如图:

非常的麻烦和费劲,而且由于表字段也比较多,也不能用线条去一一对应,因此最近去了解学习了一下血缘关系和具体的相关软件。

二.软件使用,马哈鱼数据血缘分析软件(不是很推荐)

官网:
SQLFlow 马哈鱼数据血缘分析工具,专业数据治理团队的选择 - SQLFlow

试用页面:
SQLFlow: Visualize column impact and data lineage to track columns across transformations by analyzing SQL query. (gudusoft.com)

如图选择 数据库,放入SQL语句,最后选择分析:

分析如图:

并且可以选择设置分析条件:

ER图和字段位置:

为什么不推荐使用?

如图他可以选择连接本地数据库,或是上传文件进行分析。

但是经过我的尝试我发现连接不上,不仅是我的虚拟机hive连接不上而且就连我本地的mysql也连接不上,我去官网查看使用说明发现可能是账户不是付费用户。

 于是进入它的免费试用申请:

点击提交无法申请,点击半天也没动静。因此综上我认为马哈鱼用起来并不舒服不推荐使用。

三.软件使用,Datablau(国产血缘分析)

官网:企业简介 - Datablau - 数语科技
在线使用:Datablau SQLink 血缘解析工具

也可以免费试用,但是会打电话访问,介意的话就直接使用网页版:

页面上的名词解释:

DDM

指的是分布式数据库中间件(Distributed Database Middleware),是华为云提供的服务之一,它使用华为关系型数据库(RDS)作为存储引擎,为应用提供透明、高效、可靠的分布式数据库访问能力。

DAM

指的是数字资产管理(Digital Asset Management)专门用于管理和存储数字资产(如图片、视频、音频、文档等)的系统。

DDC

分布式数据中心(Distributed Data Center)在数据中心和云计算领域,DDC还可能指分布式数据中心。分布式数据中心是传统IDC的升级方案,也是下一代超高速网络的信息基础设施。

DDS

分布式数据系统(Distributed Data Systems)定义:DDS也可以指分布式数据系统,是一种用于数据的分布式管理和通信的系统。其核心在于数据的分布性和实时性。

Datablau D3

Datablau D3是一款专业的数据开发管理工具,它将数据需求、模型设计、模型管控、数据开发、数据运维、项目交付、数据治理融为一体。

DDM Archy

DDM Archy是基于Datablau DDM推出的一个架构建模套件产品。适用于各种需要高效管理数据架构和资产的场景,如金融、电商、医疗、教育等行业的数据仓库建设、数据挖掘、数据分析等。

SQLink

通过SQL Link,可以在不同数据库之间建立连接,实现数据的共享和交互。这种技术通常用于在不同的数据库中进行数据查询和操作,使得不同数据库之间的数据可以互相访问和交换。

如图我还以为是跟阿里云之类的申请就可以直接用一段时间,但是还要 电话联系,如果知道的话就不申请了。

页面如下:

能看出来页面都大差不差,但是当然还是使用汉字的更舒服。而且对于我们个人学习使用来说,这网页的功能也足够使用了。

网页仅有两个操作:

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/893924.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

PyTorch 2.5 发布带来一些新特性和改进

官网:https://github.com/pytorch/pytorchGitHub:https://github.com/pytorch/pytorch原文:https://github.com/pytorch/pytorch/releases/tag/v2.5.0 主要亮点 (Highlights)] SDPA CuDNN 后端:为 torch.nn.functional.scaled_d…

Zico 2 靶机 - 详细流程

✨ 准备工作 靶机 && kali 环境要求 机器名网络配置靶机Zico 2NAT 模式攻击机kaliNAT 模式 靶机下载链接:zico2: 1 ~ VulnHub 打开 VMware,将 zico2.ova 拖拽到 VMware 中 设置 虚拟机名称(A) - 存储路径(P)- 导入 若是,…

3DsMax删除FBX 导出的预设

3DsMax删除FBX 导出的预设 文档 https://help.autodesk.com/view/3DSMAX/2025/CHS/?guidGUID-9939F041-5E2D-4AA8-A732-6C2A1DFB5314删除静态FBX 这个预设 使用everything 搜索预设文件的后缀.fbxexportpreset ,然后 文件路径 C:\Users\GoodCooking\Documents\3…

C++标准模板库--vector

vector 介绍 vector(向量)是一种序列容器,表示为可以改变大小的数组。vector中的元素使用连续的存储位置,这意味着也可以使用指向其元素的常规指针偏移量来访问任意元素,且与数组一样高效。但与数组不同的是&#xff…

React01 开发环境搭建

React 开发环境搭建 一、创建 React 项目二、项目精简 一、创建 React 项目 执行下述命令创建 react 项目 blu-react-basis npx create-react-app blu-react-basis项目目录结构如下: 执行下述命令启动项目 npm run start启动效果如下: 二、项目精简 …

51单片机的万年历【proteus仿真+程序+报告+原理图+演示视频】

1、主要功能 该系统由AT89C51/STC89C52单片机LCD1602显示模块时钟模块按键蜂鸣器等模块构成。适用于电子万年历、数字时钟万年历等相似项目。 可实现功能: 1、LCD1602实时显示年月日星期和北京时间,具备闰年判断功能 2、按键可设置闹钟时间 3、按键可修改当前时…

案例-登录认证

案例-登录认证 在前面的课程中,我们已经实现了部门管理、员工管理的基本功能,但是大家会发现,我们并没有登录,就直接访问到了Tlias智能学习辅助系统的后台。 这是不安全的,所以我们今天的主题就是登录认证。 最终我们…

redo文件误删除后通过逻辑备份进行恢复

问题描述 开发同事让在一个服务器上查找下先前库的备份文件是否存在,如果存在进行下恢复。翻了服务器发现备份文件存在,多愁了一眼竟翻到了该备份文件于2024.6.17日恢复过的日志,赶紧和开发沟通说2024.6.17号已经恢复过了为啥还要恢复&#x…

空间大数据的数据变换与价值提炼

在数字化时代,空间大数据正成为推动社会经济发展的关键因素。空间大数据不仅体量巨大,而且具有高速流转、多样类型和真实性等特点,它们在获取、存储、管理、分析方面超出了传统数据库软件工具的能力范围。地理信息系统(GIS&#x…

AWS账号与邮箱的关系解析

在当今数字化时代,云计算服务的普及使得越来越多的企业和个人用户开始使用亚马逊网络服务(AWS)。作为全球领先的云服务平台,AWS为用户提供了丰富的计算、存储和数据库服务。然而,对于许多新用户来说,关于AW…

openresty通过header_filter_by_lua记录特定的请求头和特定的响应头到日志文件

有时我们希望记录特定的请求头信息和特定的响应头信息,以便能够通过关联请求信息和响应头信息,来实现记录请求和响应的对应关系。这里通过逐步尝试和优化的方式进行尝试。具体包括将需要的请求头和响应头组织到一条日志记录,输出到单独的错误日志文件记录等的配置尝试。 1.…

C语言中的文件操作:从基础到深入底层原理

文件操作是几乎所有应用程序的重要组成部分,特别是在系统级编程中。C语言因其高效、灵活以及接近硬件的特点,成为了文件操作的理想选择。本文将全面深入地探讨C语言中的文件操作,从文件系统的概念到具体的文件操作函数,再到底层的…

c++的哈希表、哈希桶的介绍与实现

目录 前言 哈希概念 哈希冲突 哈希函数 哈希冲突解决 闭散列 —— 开放定址法 开散列 —— 链地址法(拉链法、哈希桶) 哈希表的闭散列实现 哈希表的结构 哈希表的仿函数 哈希表的插入 哈希表的查找 哈希表的删除 哈希表的开散列实现&#xff…

如何查看默认网关地址:详细步骤

在日常的网络配置与故障排查中,了解并正确查看默认网关地址是一项基础且至关重要的技能。默认网关是连接本地网络与外部网络(如互联网)的关键节点,它扮演着数据包转发的重要角色。无论是家庭网络、办公室网络还是更复杂的网络环境…

MySQL:基于Spring监听Binlog日志

binlog的三种模式 MySQL 的二进制日志(binlog)有三种不同的格式,通常被称为 binlog 模式。这三种模式分别是 Statement 模式、Row 模式和Mixed 模式。 Statement 模式: 在 Statement 模式下,MySQL 记录每个会更改数…

【编程语言】Kotlin快速入门 - 类与对象

类的组成 Kotlin中类的基本组成可写成以下的形式,Kotlin也是使用class关键字声明一个类的,我在此也同时加入了name和age两个字段。 class Student: Person() {var name ""var age 1fun eat() {println("$name is $age")} }Kotli…

WebGL编程指南 - 入门续

相关内容:在attribute变量传递参数的基础上,通过JavaScript获取鼠标事件的坐标,再经过坐标转换传递给attribute变量;Web颜色缓冲区每次绘制之后都会重置相关函数:JavaScript鼠标事件onmousedown/onmouseup/onclick htm…

0基础学java之Day09(下午完整版)

六、数组 概念: 1.数组是引用数据类型 2.数组中的数据叫做元素 3.元素都有标号叫做索引/下标 4.下标从0开始 5.数组一旦初始化成功,长度不可变(意味着数组没有添加和删除) 6.数组中的元素在内存中是挨在一起的 声明: 数…

数据结构与算法 - 树 #数的概念 #二叉树 #堆 - 堆的实现/堆排序/TOP-K问题

文章目录 前言 一、树 (一)、概念 1、树的定义 (二)、树的定义 1、树为什么是递归定义的? 2、如何定义树(如何表达一棵树) 解决方案一:假设我们得知该树的度 解决方案二:顺序表 解决方案三:左孩子右兄弟表示法 二、二叉…