Databricks 收购 Tabular 的意义:数据开放框架的胜利

Databricks 宣布收购 Tabular,这是一个由 Apache Iceberg 的原始创建者开发的数据平台,在数据分析行业引发了涟漪。此次收购凸显了开放框架在数据领域日益增长的重要性,预示着数据管理、分析和 AI/ML 计划领域的创新、协作和可访问性的新时代。MinIO 一直是 Apache Iceberg 的粉丝,并且与 Tabulal 的团队关系密切。我们已经写了许多关于这项技术如何与高性能对象存储一起工作的基础文章。在下一章中,我们为他们感到兴奋。

开放框架的兴起

开放框架彻底改变了我们处理数据的方式。与将用户锁定在特定平台和工具中的专有系统不同,开放框架提供了灵活性、互操作性和透明度。它们使组织能够利用可用的最佳工具,集成各种数据源,并定制解决方案以满足特定需求,而不受供应商限制的限制。

虽然有些人可能会质疑 Databricks 收购 Tabular 背后的动机,特别是考虑到收购是在 Snowflake 的年度用户大会上宣布的,当时有传言称 Snowflake 本身正在谈判收购 Tabular,但 Databricks 确实拥有开源的诚意,可以为 Iceberg 和更广泛的社区做出积极贡献。这是通过他们对表格的投资来实现的,也许更重要的是,通过有效地雇用冰山格式的创建者。Databricks 历来是开源技术的坚定拥护者,收购 Tabular 符合其培养开放数据生态系统的使命。

虽然我们支持开放框架的任何扩展,无论是物质的还是意识形态的,但组织可以从这场非常公开的战斗中吸取什么教训?至少,很明显,开放表格式是现代数据基础设施的基石。在考虑未来时,组织应专注于能够有效利用这些强大格式的工具和技术。

开放框架在现代数据湖中的作用

现代数据湖作为集中式存储库,用于存储大量结构化和非结构化数据,为高级分析和 AI 计划提供所需的灵活性。显然,为了在 AI 用例中发挥作用,现代数据湖必须建立在高性能、弹性和可扩展的存储之上。

将开放框架集成到这些面向未来的数据湖中具有变革性,因为它增强了它们已经内置的可扩展性、灵活性和互操作性。开放框架使组织能够避免供应商锁定(尤其是在主要供应商急于支持 Iceberg 的情况下),并提供与各种数据源和分析工具轻松集成的灵活性,以及与各种数据源和分析工具轻松集成的灵活性。这两项功能对于构建强大、面向未来的数据基础架构至关重要。

随着 Apache Iceberg、Apache Hudi 和 Delta Lake 等开放框架的兴起,现代数据湖在打破数据孤岛、实现数据访问民主化以及促进更具协作性和创新性的数据生态系统方面的作用得到了强调。以下是这些好处的细分。

增强互操作性和灵活性

开放框架的主要优势之一是它们能够增强互操作性。在当今数据驱动的世界中,组织通常依靠无数的工具和平台来收集、存储、分析和可视化数据。开放框架充当桥梁,允许这些不同的系统无缝通信。

当开放框架部署在 MinIO 上时,用户会放大这种固有的互操作性和灵活性。现代数据湖中的这种强大组合可确保您的数据可以在您需要的任何地方高效访问、管理和处理:私有云、公共云、colos 或边缘。归根结底,运营灵活性并非易事。

通过协作推动创新

开放框架在协作中茁壮成长。就其本质而言,开源项目邀请全球开发人员、研究人员和数据科学家社区做出贡献。这种协作方法可以加速创新,因为可以快速开发、测试和实施新的想法和解决方案。事实是,开源催生了开源,尤其是在人工智能领域。在数据驱动创新的时代,比以往任何时候都更清楚,数据基础设施的未来是开源的。

实现数据访问的民主化

也许开放框架最深远的影响是它们在数据访问民主化方面的作用。通过降低进入门槛,开源工具使各种规模和预算的组织能够利用数据的力量。这种民主化对于创造公平的竞争环境和确保即使是小企业也能在数据驱动的经济中竞争至关重要。

只要有开放框架,这种民主化就是正确的,但对于像MinIO这样建立在开源对象存储上的基础设施来说尤其如此。这种简单易用和部署的基础架构进一步降低了成本和复杂性,使更广泛的组织能够使用强大的数据存储以及 AI 和分析功能。借助 MinIO 和开放式框架,您可以事半功倍。

把它带回家

展望未来,很明显,开放、协作和可访问性原则将继续推动数据环境的发展。Databricks 收购 Tabular 的战略举措凸显了这一驱动力。通过拥抱和投资开放框架,您的组织不仅可以增强其平台,还可以倡导数据比以往任何时候都更易于访问、互操作和创新的未来。这些原则对于构建真正成功的 AI 计划至关重要。

不要落后于自己的基础架构,而是使用 Iceberg 或 Hudi 等开放格式以及世界上最快的对象存储软件开始构建组织自己的现代数据湖。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/790917.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Prometheus+Grafana主机运行数据

目录 介绍 安装Node Exporter 配置Prometheus 验证配置 导入仪表盘 介绍 Prometheus是一款开源的监控和警报工具,而Node Exporter是Prometheus的一个官方插件,用于采集主机上的各种系统和硬件指标。 安装Node Exporter 下载最新版本的Node Export…

盲盒抽卡机小程序:抽卡机的多样化发展

近几年,盲盒卡牌出现在了大众的生活中,深受学生和年轻消费者的喜爱。卡牌是一种新的盲盒模式,玩家购买后随机获得卡牌,为了收集一整套卡牌,玩家会进行各种复购行为,卡牌逐渐成为了年轻人追捧的休闲方式&…

雨量监测站的重要性有哪些

在全球气候变化和极端天气事件频发的背景下,雨量监测站成为了我们理解降水模式、预测天气变化以及制定应对措施的重要工具。 雨量监测站是一种专门用于测量和记录降水量的设施。它们通过配备高精度的雨量传感器,能够实时监测降雨情况,并提供关…

​​​​​​​生物素化药物分子的特性

生物素化药物分子是指将生物素(维生素H,也称维生素B7或维生素B8)共价连接到药物分子上的过程。这种处理方式为药物分子带来了多种特性和优势,以下是对生物素化药物分子的详细解析: 一、生物素的基本特性 生物素是一种水…

碾压SOTA!最新视觉SLAM:渲染速度提升176倍,内存占用减少150%

视觉SLAM,一种结合了CV与机器人技术的先进方法。与激光SLAM相比,它成本低廉且信息量大,易于安装,拥有更优秀的场景识别能力,因此在自动驾驶等许多场景上都非常适用,是学术界与工业界共同关注的热门研究方向…

【运维】docker批量删除临时镜像(两种方式)

docker批量删除Tag<none>的临时镜像 在开发的时候&#xff0c;需要经常发布开发包&#xff0c;在使用docker build构建镜像的时候&#xff0c;同一个版本经常会使用相同tag&#xff0c;频繁打包一段时间后&#xff0c;本地会出现很多Tag<none>的临时镜像&#xff…

首届UTON区块链开发者计划大会在马来西亚圆满落幕

7月9日&#xff0c;首届UTON区块链开发者计划大会在马来西亚吉隆坡成功举办&#xff01; 来自全球顶尖的行业领袖、技术精英和众多区块链爱好者参与了此次盛会&#xff0c;也标志着UTON区块链生态进入了一个全新的发展阶段。 会上&#xff0c;UTON区块链创始人之一唐毅先生以“…

四道经典算法JAVA

1.爬楼地 爬20个台阶的爬法:f(19)f(18) 经典斐波拉契数列问题 public class demo4 {//爬楼梯问题public static void main(String[] args) {System.out.println(getSum(20));}public static int getSum(int n) {if (n 1)return 1;if (n 2)return 2;return getSum(n - 1) …

从零开始学习嵌入式----Linux系统命令集合与shell脚本

Shell是一门编程语言&#xff0c;作为学习shell的开始&#xff0c;需要事先搞明白&#xff1a;编程的目的是什么&#xff1f;什么是编程语言&#xff1f;什么是编程&#xff1f; shell本身就是一门解释型、弱类型、动态语言&#xff0c;与python相对应&#xff0c;Python属于解…

mysql查询语句执行流程

流程图 连接器&#xff1a;建立连接&#xff0c;管理连接、校验用户身份&#xff1b;查询缓存&#xff1a;查询语句如果命中查询缓存则直接返回&#xff0c;否则继续往下执行。MySQL 8.0 已删除该模块&#xff1b;解析 SQL&#xff0c;通过解析器对 SQL 查询语句进行词法分析、…

服务器提交记录有Merge branch消除

背景&#xff1a;在共同开发分支release上&#xff0c;你提交了commit&#xff0c;push到服务器上时&#xff0c;发现有人先比你push了&#xff0c;所以你得先pull&#xff0c; 后再push&#xff0c;然而pull后自动产生了一个Merge branch的一个commit&#xff0c;这个commit本…

linux watchdog 子系统

目录 一、watchdog 子系统二、关键数据结构2.1 watchdog_device2.2 watchdog_ops2.3 watchdog_info 三、重要流程3.1 watchdog 初始化3.2 watchdog 设备注册3.3 watchdog 设备文件操作函数3.4 watchdog 喂狗用户空间 watchdog&#xff08;busybox&#xff09;内核空间喂狗疑问 …

防火墙综合实验一

目录 实验要求 防火墙准备 IP地址分配 需求一 需求二 需求三 需求四 需求五 需求六 实验要求 1、DMZ区内的服务器&#xff0c;办公区仅能在办公时间内(9:00-18:00)可以访问&#xff0c;生产区的设备全天可以访问。 2、生产区不允许访问互联网&#xff0c;办公区和游客…

单向链表队列

实现单向链表队列的&#xff0c;创建&#xff0c;入队&#xff0c;出队&#xff0c;遍历&#xff0c;长度&#xff0c;销毁。 queue.h #ifndef __QUEUE_H__ #define __QUEUE_H__#include <stdio.h> #include <stdlib.h> #include <string.h> #define max 30…

图论---无向图中国邮路的实现

开始编程前分析设计思路和程序的整体的框架&#xff0c;以及作为数学问题的性质&#xff1a; 程序流程图&#xff1a; 数学原理&#xff1a; 本质上是找到一条欧拉回路&#xff0c;考虑图中的边权重、顶点的度数以及如何通过添加最少的额外边来构造欧拉回路&#xff0c;涉及到欧…

PLC数采网关在实际应用中有哪些效能?天拓四方

在工业自动化领域中&#xff0c;PLC扮演着至关重要的角色&#xff0c;它负责控制和监测生产线的各个环节。然而&#xff0c;随着工业4.0的推进和智能制造的快速发展&#xff0c;单纯依靠PLC进行现场控制已无法满足企业对数据集中管理、远程监控和智能分析的需求。因此&#xff…

筑牢代码安全之盾 —— 沙箱在源代码防泄密中四大特性

在这个数字化飞速发展的时代&#xff0c;源代码作为企业的核心资产&#xff0c;其安全性显得尤为重要。一旦泄露&#xff0c;不仅可能导致知识产权的损失&#xff0c;还可能引发一系列连锁反应&#xff0c;威胁企业的生存和发展。在这样的背景下&#xff0c;SDC沙盒以其独特的产…

洛杉矶裸机云大宽带服务器的特性和优势

洛杉矶裸机云大宽带服务器是结合了物理服务器性能和云服务灵活性的高性能计算服务&#xff0c;为用户提供高效、安全的计算和存储能力。在了解如何使用洛杉矶裸机云大宽带服务器之前&#xff0c;需要了解其基本特性和优势。以下是对洛杉矶裸机云大宽带服务器的具体分析&#xf…

ZFT9-7VE8043-Z同期脉冲发送装置100V JOSEF约瑟 柜内安装

ZFT9(PIG)同期脉冲发送装置 系列型号 ZFT9(PIG) 7VE8033同期脉冲发送装置; ZFT9(PIG) 7VE8043同期脉冲发送装置; ZFT9 7VE8033同期脉冲发送装置; ZFT9 7VE8043同期脉冲发送装置; 用途&#xff1a; ZFT9同期脉冲发送装置用于船舶的三相系统&#xff0c;根据发电机和电力系…

突发,众多网站流量被盗刷!事情没那么简单。。

这两天发生了一件震惊 IT 圈的大事&#xff0c;很多程序员博主的网站竟然 同时 被恶意攻击&#xff0c;盗刷了大把流量费&#xff0c;我这个老倒霉蛋自然也中招了&#xff0c;作为受害人&#xff0c;专门做了本次分享&#xff0c;希望其他有网站的朋友们也都小心点。 那为什么…