统一数据治理平台OpenMetadata 1.4.0版本发布!数据血缘、高级数据质量报告功能发布!...

4959667c2d16107888ffc6e9de8935c6.png

OpenMetadata作为数据治理和元数据管理领域的领先开源平台,持续致力于满足数据用户和组织的多样化需求。最新的1.4.0版本为用户带来了一系列创新功能和重大改进,进一步增强了平台的功能性和易用性。

我们在社区统计数据中也看到了OpenMetadata的增长:

  • GitHub 上有近4400 颗星(比上一个版本多了 800 颗星)

  • 250 位开源贡献者(自上一版本以来增加了 25 位)

  • +850 提交合并1.4 版本

此版本中的增强功能和我们获得的社区支持进一步证明 OpenMetadata 确实是迄今为止最好的开源元数据项目。

本文为大家整理了一下主要的更新内容,更多的详细内容可在官网进行查看。

数据血缘和可观察性的重大升级

数据血缘的改进是本次更新的一大亮点。OpenMetadata现已支持通过API和UI连接所有数据资产类型及其字段/模式的血统,包括表、管道任务、仪表板图表、ML模型特征和主题字段等。此外,支持的血缘关系也得到扩展,如管道任务与任意两个实体类型之间的血源关系。这一改进大幅增强了对数据流向的全面洞察。

以前,我们将管道限制为仅两个表之间的沿袭。现在,我们支持将管道作为任意两个实体类型之间。我们还升级了对 Tableau、Superset、Qlik Cloud 和 Qlik Sense 数据模型和表之间列级沿袭的支持。OpenMetadata Spark Agent 现在支持 Snowflake 和 Databricks 的表及其原始存储容器之间血缘获取。我们现在支持解析 PowerBi DAX 文件的沿袭,以及 Snowflake 动态表。我们将继续扩展到不同的服务。

605ad98e838ceeb63ac8581bbb32321f.png

为提高血缘可视化的易用性,OpenMetadata引入了"血缘层"概念,用户可根据需求在列级和数据观察层等多个层次间切换。同时,新增的列级血缘搜索功能也让跟踪列变形位置更加便捷。此外,团队还优化了血缘图显示、导出等体验细节。

e005a87603a27674c62525b59c6964a4.png

数据质量和可观察性的改进

在数据质量和可观察性方面,新增的数据可观察性过滤器使用户能按表、平台、测试类型、状态等多种维度对测试用例进行细粒度分析。同时,上手难度也得到降低,如表架构页面直接显示每列的数据质量测试、允许更新显示名称等。

35a6c119f6ec85037614a40685ee842a.png

数据分析器全面升级,可全局管理分析配置

数据分析器是OpenMetadata的核心功能之一。在1.4.0版本中,新增的分析器配置页面使用户能够按数据类型自定义计算指标,从而轻松管理分析并优化性能。同时,分析器支持得到扩展,覆盖了Redshift复杂类型和NoSQL源。一系列性能改进也使分析过程更加高效,如优化大值求和、支持科学记数法直方图等。

f231a9d11d8e9d9d7781646e4a98a6ae.png

摄取性能大幅提升,降低成本

作为元数据集中管理的利器,OpenMetadata一直在加强摄取连接器的性能。1.4.0版本引入了增量元数据摄取的创新方案,通过扫描查询历史记录中的DML操作来减少不必要的数据扫描,目前已支持BigQuery、Redshift和Snowflake。此外,引入对数据库模式级并行化提取的支持,也进一步提高了效率。

数据洞察帮助提高数据质量和生产力

数据洞察模块可定义数据描述和所有权KPI,帮助团队达成文档目标。新版本新增了识别未记录或缺乏所有权资产的选项,使团队能够高效解决这一痛点,提升整体元数据质量。此外,报告界面也得到优化,提供更直观、可用的资产洞察。

自定义属性提升元数据管理灵活性

自定义属性功能得到重大增强,现已支持实体引用和实体引用列表等高级属性类型。用户可以方便地将数据资产与平台内其他实体建立关联,从而丰富元数据内涵,提升管理灵活性。

a501cf4c59ee315e40c28ec66742d485.png

自定义主题

OpenMetadata 为元数据平台设定了 UX/UI 设计标准。借助自定义主题功能,管理员可以创建个性化主题以匹配其组织的调色板,从而确保提供统一且品牌化的用户体验。

39409fa9a66eae1aa17c37321dda6ec6.png

健康检查状态页面

382144914abba5051a80d046c7701ad5.png

OpenMetadata 以其易用性和可维护性而闻名。我们新的健康检查页面进一步简化了验证所有配置是否正确设置的过程,帮助新采用者最大限度地利用 OpenMetadata。

其他增强功能全面改善用户体验

OpenMetadata 1.4.0版本中,还包括了诸多其他改善用户体验的增强功能:

  • 活动提要界面得到优化,提供不同实体的丰富上下文信息

  • SSL证书管理改进,支持直接通过UI传递证书

  • 新增Kafka Connect、Qlik Cloud等连接器

  • 表架构页面支持查看DDL定义

与此同时,OpenMetadata也对社区支持和文档做了相应调整,引入新的工具如openmetadata-ops.sh,并弃用了部分过时功能。总的来说,这些改动都是为了给用户带来更简单、高效的体验。

不可否认,1.4.0版本中部分改动带来了向后不兼容的变更,如活动源、Lineage视图、批量导入导出API等更新。OpenMetadata这次1.4.0的升级再次彰显了其在元数据管理和数据治理领域的雄心和决心。功能强大且不断进化的OpenMetadata,必将持续助力全球组织构建现代化的数据格局。期待其在未来带来更多创新功能,帮助用户充分释放数据价值。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/722209.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

JVM 基本组成

一、为什么要学习 JVM ? 1. “ ⾯试造⽕箭,⼯作拧螺丝” , JVM 属于⾯试官特别喜欢提问的知识点; 2. 未来在⼯作场景中,也许你会遇到以下场景: 线上系统突然宕机,系统⽆法访问,甚⾄直…

谷粒商城实战(042集群学习-mysql集群-主从同步)

Java项目《谷粒商城》架构师级Java项目实战,对标阿里P6-P7,全网最强 总时长 104:45:00 共408P 此文章包含第361p-第p363的内容 集群 集群的基础形式 MySQL集群 MMM机制 这里使用了vip虚拟ip方式(如192.168.0.101,192.168.0.102&…

Qt Quick 教程(一)

文章目录 1.Qt Quick2.QML3.Day01 案例main.qml退出按钮,基于上面代码添加 4.使用Qt Design StudioQt Design Studio简介Qt Design Studio工具使用版本信息 1.Qt Quick Qt Quick 是一种现代的用户界面技术,将声明性用户界面设计和命令性编程逻辑分开。 …

【Hive安装】— “schematool -initSchema -dbType mysql -verbose” 报错!!!

项目场景:Hive 元数据配置到 MySQL 执行 “schematool -initSchema -dbType mysql -verbose” 命令 问题描述 报错:org.apache.hadoop.hive.metastore.HiveMetaException: Schema initialization FAILED! Metastore state would be inconsistent !! 原因…

Exploring Performance and Cost Optimization with ASIC-Based CXL Memory——论文阅读

EuroSys 2024 Paper CXL论文阅读笔记整理 问题 随着内存密集型应用程序对内存需求的增加,受限于物理限制,如DDR DIMM插槽的可用性和发热问题,以及使用高密度DIMM的成本考虑,现代应用程序的内存需求很容易超过单机的内存容量[2&a…

【漏洞复现】海康威视 综合安防管理平台 session接口 远程代码执行漏洞

免责声明: 本文内容旨在提供有关特定漏洞或安全漏洞的信息,以帮助用户更好地了解可能存在的风险。公布此类信息的目的在于促进网络安全意识和技术进步,并非出于任何恶意目的。阅读者应该明白,在利用本文提到的漏洞信息或进行相关测…

【2024最新华为OD-C/D卷试题汇总】[支持在线评测] K小姐的座位分配(100分) - 三语言AC题解(Python/Java/Cpp)

🍭 大家好这里是清隆学长 ,一枚热爱算法的程序员 ✨ 本系列打算持续跟新华为OD-C/D卷的三语言AC题解 💻 ACM银牌🥈| 多次AK大厂笔试 | 编程一对一辅导 👏 感谢大家的订阅➕ 和 喜欢💗 &#x1f…

42、基于神经网络的训练堆叠自编码器进行图像分类(matlab)

1、训练堆叠自编码器进行图像分类的原理及流程 基于神经网络的训练堆叠自编码器进行图像分类的原理和流程如下: 堆叠自编码器(Stacked Autoencoder)是一种无监督学习算法,由多个自编码器(Autoencoder)堆叠…

【Windows】配置Flutter开发环境

一、下载 flutter sdk 点此跳至下载官网 下载好flutter sdk,并解压到自定义的位置。 二、配置环境变量 此电脑 --> 右键 选择 属性 --> 点击 高级系统设置 --> 会弹出系统属性的窗口,点击 环境变量 按钮 1.配置加速镜像地址 PUB_HOSTED_…

IP协议的相关特性

IP协议的报文结构 如图: 上述的IP协议是ipv4的版本,如上述图中的4位版本号。 现当今的世界仅有两个版本分为ipv4和ipv6。 在这里我以ipv4来介绍IP协议。 IP协议的报头最长为60个字节,最短为20个字节。 如图8个服务类型: 这里不…

python5 正则表达式

Python中的正则表达式是一种强大的工具,用于在文本中搜索、匹配和处理特定模式的字符串。它们通过定义一种模式,使得可以轻松地搜索、替换、提取和验证文本数据,在Python中的正则表达式由re模块提供支持的。 正则表达式通常用于以下任务&…

【HTML01】HTML基础-基本元素-附带案例-作业

文章目录 HTML 概述学HTML到底学什么HTML的基本结构HTML的注释的作用html的语法HTML的常用标签:相关单词参考资料 HTML 概述 英文全称:Hyper Text Markup Language 中文:超文本标记语言,就将常用的50多个标记嵌入在纯文本中&…

AI办公自动化:用通义千问批量翻译长篇英语TXT文档

在deepseek中输入提示词: 你是一个Python编程专家,现在要完成一个编写基于qwen-turbo模型API和dashscope库的程序脚本,具体步骤如下: 打开文件夹:F:\AI自媒体内容\待翻译; 获取里面所有TXT文档&#xff…

【博弈】843. 猜猜这个单词

本题涉及知识点 博弈 LeetCode843. 猜猜这个单词 给你一个由 不同 字符串组成的单词列表 words ,其中 words[i] 长度均为 6 。words 中的一个单词将被选作秘密单词 secret 。 另给你一个辅助对象 Master ,你可以调用 Master.guess(word) 来猜单词&…

APS-SCM联动:开创生产调度与供应链管理新篇章

在当今激烈的市场产品竞争环境下,企业不仅需要灵活高效的内部生产流程,更需具备对外部环境快速响应的能力,从而保证产品保质保量的生产完成,快速占据更多的市场份额。正是在这样的背景下,APS(Advanced Plan…

从社交网络到元宇宙:Facebook的战略转型

随着科技的迅猛发展和数字化时代的深入,社交网络已不再局限于简单的信息交流和社交互动,而是逐步向更广阔、更深远的虚拟现实空间——元宇宙(Metaverse)转变。作为全球最大的社交网络平台之一,Facebook正在积极推动这一…

JS安全应用

JS应用 常见分析调试: -代码全局搜索 案例 登录框,可以看到发送用户名密码被JS加密 搜索Username,找到加密地方 logindata.UserName encodeURI(encrypt.encrypt(numMobile));logindata.Mobile encodeURI(encrypt.encrypt(numMobile));…

Python将Markdown格式转为HTML:轻松实现博客文章的自动化处理

哈喽,大家好,我是木头左! 引言 编写一篇高质量的博客文章并非易事,尤其是在排版和格式方面。Markdown作为一种轻量级的标记语言,为博主们提供了一种简洁、高效的写作方式。而Python作为一门强大的编程语言&#xff0c…

SpringBoot的入门案例

1、创建一个Maven工程 2、点击设置自动导入jar包 3、导入spring boot需要的依赖 打开sping boot的文档 导入依赖的pom.xml配置内容 4、创建一个spring boot的执行入口程序 5、写controller,service,dao的页面逻辑代码 6、测试,运行工程&#…