二十年大数据到 AI,图灵奖得主眼中的数据库因果循环

最近,MIT 教授 Michael Stonebraker 和 CMU 教授 Andrew Pavlo (Andy) 教授联合发表了一篇数据库论文。Michael Stonebraker 80 高龄,是数据库行业唯一在世的图灵奖得主,Andy 则是业界少壮派里的最大 KOL。

file

一老一少,当今数据库届最王炸的组合,合作写的论文题目是

file

作为业界顶流,当然是不会刷「An Empirical Comparison of xxx」的水文。不过 What Goes Around Comes Around 的标题也着实特别,中文翻译过来是「种瓜得瓜,种豆得豆」,「因果报应」,而后面又跟了一个 Around。其实这是一篇续作,在差不多 20 年前,Stonebraker 教授和另一位教授,UC 伯克利的 Joseph M. Hellerstein 曾经合著了一篇

file

而 Andy 其实也是 Stonebraker 教授那篇文章的粉丝。

file

当年论文的起因是当时数据库界兴起了一股反关系型,反 SQL 的浪潮。而在两位教授眼里,其实是历史的倒退,于是忍不住写了一篇科普文,好心劝大家这些看着时髦的东西之前已经玩过一轮了。

file

而这次论文的时间点也刚好,站在云和 AI 交叉点之间。下面做一些论文的摘录。

介绍

首先呼应了一下当年的论文,列出了数据库到 2005 年的演进史。

file

然后列出了近 20 年的发展,分别从数据模型/查询语言(Data Models & Query Languages),以及系统架构(System Architectures) 两部分入手。

file

file

数据模型和查询语言

file

继续呼应当年的论文,事实证明当年的论文判断都没有错。NoSQL 只是一时狂热,当年的 NoSQL 要么都挂了,活下来的,也都老老实实地加上了类 SQL 的语法。

file

谈到被 AI 带起来的向量数据库,论文的观点是传统的关系型数据库和向量数据库,会和当年的 NoSQL 一样,双向奔赴。

系统架构

file

列存系统因为优越的性能颠覆了整个数据仓库。

file

云改变了整个数据库架构,也是所谓的云原生数据库。

图片

云模式也诞生了新的商业模式,以及开源厂商和云厂商间新的商业竞争。

file

file

数据湖从一个看似糟糕的主意,经过各种中间件加持,变得可以接受了(数据量那么大,也没有办法)。

file

NewSQL 同时吸收传统关系型数据库和 NoSQL 的优点。

file

硬件加速,无足轻重。

file

区块链数据库,币圈交易所自己都不用。

教授的总结

file

Oracle,MySQL,Mongo,流行难道是原罪?

file

file

file

小心大公司开源的数据库,人家只是为了晋升,还请你们不要当真。

file

上手体验很重要,瞧瞧人家 DuckDB。

file

file

ORM 是不错,但到头来 SQL 也还是逃不过。

file

file

数据库结合 AI,长期乐观,短期怎么交差?

个人点评

前后两篇 What Goes Around Comes Around 都很值得一读。我是在 2010 年前后读到了第一篇,由那篇论文才得以系统性地了解数据库的发展史。而最近的这篇,一方面有近 20 年数据库的发展更新,一方面也有对第一篇里的复盘,所以包含了更多的商业洞见。历史对将来总是有借鉴意义,比如对于向量数据库的展望,我们可以参考之前 NoSQL 数据库的发展。但未来又总是无法预测,即使是全球最顶尖的教授,在当年的第一篇论文里,Open-Source 和 Cloud 两个词的出现次数均为 0。

file

file

而 open-source 和 cloud 是近 20 年里,推动数据库行业前进最核心的两个因素。在新的这篇,open-source 和 cloud 分别出现了 17 和 42 次。

file

file

另外值得一提的,是在这次新的论文中,也提到了国内数据库厂商,向量数据库赛道的 Milvus 和 NewSQL 的 TiDB。

file

file

从大型机,小型机,到互联网,云计算,每一次信息行业的变革,数据库都不会缺席。当下的数据库虽然暂时被淹没在了 AI 的浪潮中,但未来可期。毕竟当年我们只能看到 NoSQL,但也没想到后面更大的云和开源。

file

希望 Stonebraker 老爷子保重身体,20 年后完成三部曲。

2005 What Goes Around Comes Around. Michael Stonebraker, Joseph M. Hellerstein
https://15721.courses.cs.cmu.edu/spring2020/papers/01-intro/whatgoesaround-stonebraker.pdf

2024 What Goes Around Comes Around… And Around… Michael Stonebraker, Andrew Pavlo
https://db.cs.cmu.edu/papers/2024/whatgoesaround-sigmodrec2024.pdf


💡 更多资讯,请关注 Bytebase 公号:Bytebase

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/789231.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

[js] 对象数组按照某个属性进行分组,

要将给定的对象数组按照 field 属性进行分组 const data [{"name":"a","field":"f"},{"name":"b","field":"ff"},{"name":"v","field":"f"},{&qu…

7.深度学习概述

深度学习概述 1. 线性回归1.1 线性回归一般表达式1.2 线性回归内积表达方式:1.3 多个样本时,线性回归的进一步表达:1.4 线性回归方程的解析1.5 线性回归就是求loss函数的最小值 2. 如何求函数最小值2.1 一个例子2.2 求导法——求最小值2.3 求…

Win-ARM联盟的端侧AI技术分析

Win-ARM联盟,端侧AI大幕将起 微软震撼发布全球首款AI定制Windows PC——Copilot PC,搭载全新NPU与重塑的Windows 11系统,纳德拉盛赞其为史上最快、最强、最智能的Windows PC。该设备算力需求高达40TOPS,支持语音翻译、实时绘画、文…

1Panel 安装常见问题与解决方案指南

安装 参考 1Panel 文档 - 在线安装 部分,这里仅作常见安装失败的问题解析。 常见Q&A 收集自 1Panel微信群,论坛以及GitHub issue Q1. 安装过程中提示 docker 安装失败 [1Panel Log]: … 启动 docker Failed to enable unit: Unit file docker.ser…

哪些行业更需要TPM管理咨询公司?

当下,TPM(全面生产维护)作为一种旨在提高设备效率、降低维护成本的管理理念,已经被越来越多的行业所认可和采纳。然而,不同行业因其特性和需求的不同,对TPM管理咨询公司的需求也各有侧重。下面将探讨哪些行…

MVC架构

MVC架构 MVC架构在软件开发中通常指的是一种设计模式,它将应用程序分为三个主要组成部分:模型(Model)、视图(View)和控制器(Controller)。这种分层结构有助于组织代码,使…

Ubuntu22.04.4 LTS系统/安装Anaconda【GPU版】

安装过程 1.wget命令行下载 下载Anaconda并保存文件至本地指定目录 wget -c https://repo.anaconda.com/archive/Anaconda3-2023.09-0-Linux-x86_64.sh -P ~/Downloads/anaconda3 查看是否下载好了 2.安装Anaconda 2.1 bash命令安装 bash后面是anaconda3下载好的路径 bash …

c语言数据结构--赫夫曼树的综合应用——发报机模拟器

实验内容: 输入HuffmanTree的参考标准底稿:输入一段字符串,作为发送方和接收方进行编码的统一标准,统计出现的字符种类数和出现的频度。 2)初始化HuffmanTree参数:给定报文中26个字母a-z及空格的出现频率{…

一.8 系统之间利用网络通信

系统漫游至此,我们一直是把系统视为一个孤立的硬件和软件的集合体。实际上,现代系统经常通过网络和其他系统连接到一起。从一个单独的系统来看,网络可视为一个I/O设备,如图1-14所示。当系统从主存复制一串字节到网络适配器时&…

BUG解决:postman可以请求成功,但Python requests请求报403

目录 问题背景 问题定位 问题解决 问题背景 使用Python的requests库对接物联数据的接口之前一直正常运行,昨天突然请求不通了,通过进一步验证发现凡是使用代码调用接口就不通,而使用postman就能调通,请求参数啥的都没变。 接口…

【SVN的使用- SVN的基本命令-SVN命令简写-注意事项-解决冲突 Objective-C语言】

一、SVN的更新命令:update 1.服务器如果新建了一个文件夹,yuanxing,版本变成6了, 我现在本地还只有三个文件夹,版本5, 终端里边,我们敲一个svn update, 我这儿就多了一个yuanxing文件夹, 这个就是更新,就是把服务器最新的代码下载下来, 假设服务器上大家提交了这…

WEB安全:网络安全常用术语

一、攻击类别 漏洞:硬件、软件、协议,代码层次的缺陷。 后⻔:方便后续进行系统留下的隐蔽后⻔程序。 病毒:一种可以自我复制并传播,感染计算机和网络系统的恶意软件(Malware),它能损害数据、系统功能或拦…

microblaze时钟更改出现时序问题

在使用microblaze时,我给的时钟是200MHz的时钟,但会在跑布线的时候出现时序上的问题,一开始是没有任何的头绪,知道我尝试更改时钟的频率才发现问题的所在。 当我把200MHz的时钟改为100MHz的时钟时,就不会出现时序上的…

JVM垃圾回收器详解

垃圾回收器 JDK 默认垃圾收集器(使用 java -XX:PrintCommandLineFlags -version 命令查看): JDK 8:Parallel Scavenge(新生代) Parallel Old(老年代) JDK 9 ~ JDK20: G1 堆内存中…

PHP禁止IP访问和IP段访问(代码实例)

PHP禁止IP和IP段访问 实现IP限制是Web开发中常见的需求之一&#xff0c;它可以用于限制特定IP地址的访问权限。在PHP中&#xff0c;我们可以通过一些方法来实现IP限制。 <?//禁止某个IP$banned_ip array ("127.0.0.1",//"119.6.20.66","192.168.…

二进制安装nexus

今天安装nexus&#xff0c;想看看别人怎么安装的&#xff0c;结果找了一圈&#xff0c;没有一个靠谱的&#xff0c; 有些题目是二进制安装nexus&#xff0c;内容是东家长李家短胡扯&#xff0c;一个字&#xff0c;不要脸&#xff1b; 详细安装步骤如下&#xff0c;一起学习&…

一举跃升!Cancer Discovery修正后IF30.6!

在科学出版界&#xff0c;影响因子&#xff08;IF&#xff09;被广泛认为是衡量期刊学术影响力的重要指标。每年6月&#xff0c;科睿唯安会发布期刊引证报告&#xff08;JCR&#xff09;&#xff0c;但这并不是最终结果。在10月份&#xff0c;JCR会进行统一的更新&#xff0c;包…

华为手机联系人不见了怎么恢复?3个小妙招,让我来揭秘

你是不是也曾遭遇过这样的尴尬&#xff1a;刚还在和朋友炫耀手机里的联系人名单有多么齐全&#xff0c;一转眼却发现联系人神秘失踪了&#xff1f; 当手机联系人丢失&#xff0c;我们就像是在茫茫大海中迷失方向的航海家&#xff0c;急需找到回家的路。手机联系人不见了怎么恢…

【NOI-题解】1108 - 正整数N转换成一个二进制数1290 - 二进制转换十进制1386 - 小丽找半个回文数1405 - 小丽找潜在的素数?

文章目录 一、前言二、问题问题&#xff1a;1108 - 正整数N转换成一个二进制数问题&#xff1a;1290 - 二进制转换十进制问题&#xff1a;1386 - 小丽找半个回文数问题&#xff1a;1405 - 小丽找潜在的素数&#xff1f; 三、感谢 一、前言 本章节主要对进制转换的题目进行讲解…

获超九成Gartner用户力推!FortiGate连续五年斩获“客户之选”称号

近日&#xff0c;Gartner Peer Insights™ 网络防火墙客户之选报告发布&#xff0c;Fortinet 连续第五年荣登这项权威榜单。该评选结果源于广大用户对 Fortinet 防火墙产品的真实反馈&#xff0c;是客户选择 Fortinet 的重要参考依据&#xff0c;也是FortiGate能够占据全球防火…