我最近在接触报表平台和中台,发现他们跟我平常用的数据库不是一个东西。然后,我开始了摸索他们的过程,终于,我在理清他们的关系以后,简单写一个入门级的区分。
数据库:
定义:
数据库是被长期存放在计算机内、有组织的、可以表现为多种形式的可共享的数据集合。
大白话是用来存储数据的地方,就像是数据的仓库。它可以被用来分享,也被规范得管理和存储着。就像是很多个excel表,按照表的用途储存起来,一个项目可能会有多个主题表,围绕特定主题或业务问题来设计和构建的。
有了它,数据管理人员可以从海量的数据中提取有价值的信息,用于业务分析和决策制定。
类型:
它分为 关系型数据库(RDBMS):如MySQL、PostgreSQL、SQL Server和Oracle,它们使用表格模型存储数据,支持SQL查询语言。
和 非关系型数据库(NoSQL):如MongoDB、Cassandra、Redis等,它们不使用表格模型,可能支持键值对、文档、宽列存储或图形数据库模型。
区别:非关系型数据库通常在处理大量分布式数据和高吞吐量读写操作时表现更好,读得比较快;
关系型数据库在处理复杂查询和事务性数据操作时表现更好,处理多表查询的时候比较方便。
当然数据库 和 数据仓库也有区别,但不展开详细说了,感兴趣的伙伴自己了解哈
数据中台:
MBA智库百科对数据中台的定义是:
“一种数据管理体系,在企业中作为独立的部门存在,主要目标是支持各部门业务数据并提供计算服务。
它的本质是“数据仓库+数据服务中间件”,是一种战略选择和组织形式,通过有形的产品和实施方法论支撑,构建一套持续不断地把数据变成资产并服务于业务的机制。”
数据中台要做四个方面的工作分别是“采集”、“存储”、“打通”,“使用”。
采集和存储就不说了。
打通就是要打通用户的行为数据和用户的业务数据,如【电商用户的浏览、点击行为 】和 【用户的支付业务数据】。整理出来的数据,可以赋能业务人员、领导层进行下一步的决策,做到数据反哺业务。
优点:
如果我们需要的数据直接连数据库,可能会有读取慢,跨表协作,查询数据量大容易崩等问题,中台在数据处理上能提高读取效率(提供实时流数据),更智能地映射不同的表,也方便做成数据资产。
跨业务线的查询和数据生成也很方便,能基于各种业务场景的应用
而且在给到业务获取数据时,也能规范人员查看权限的问题,保证数据的安全性。
也会从不同的源收集数据。这些数据源可能包括CRM系统、ERP系统、在线服务、IoT设备等。方便集成。
关于查询,我们查询数据库或者中台的数据,也还是可以使用sql的查询,使用报表平台的时候也可以使用sql。不得不说,学会sql的使用已经能解决很多的数据管理问题了~
当然中台还支持hive,impala等的查询。
报表平台:
BI 报表工具(Business Intelligence,商业智能)
- 用于分析、报告和呈现商业数据的软件应用程序
- 核心功能通常包括:数据集成、数据处理、报表生成、用户交互界面和数据可视化等。
- 它允许用户创建、设计、生成、管理和分发报表。这些报表可以是静态的或交互式的,用于展示数据的汇总、分析和可视化。
从微观来看,是给业务或者客户看一些数据呈现的地方,用来做各种图表,展示数据最后的结果。
宏观一点就是,对外展示一个企业的数据体量和它的业务生态,看下面的图,是不是感觉逼格一下子就上来了?
(网上随手一搜的BI大屏图)
我平常使用的报表平台是达芬奇,可以参考这个使用:Davinci BI报表工具~
以上是我个人的学习和理解,如果有不对的地方,欢迎讨论,一起相互学习~
参考:
MBA智库:数据中台