【系统架构设计】数据库系统(一)

数据库系统(一)

  • 数据库模式与范式
    • 数据库的结构与模式
    • 数据模型
    • 关系代数
    • 数据的规范化
    • 反规范化
  • 数据库设计
  • 事务管理
  • 备份与恢复
  • 分布式数据库系统
  • 数据仓库
  • 数据挖掘
  • NoSQL
  • 大数据

数据库模式与范式

数据库的结构与模式

数据库技术中采用分级的方法将数据库的结构划分多个层次。最著名的是美国ANSI/SPARC数据库系统研究组1975年提出的三级划分法,如图3-1所示。

在这里插入图片描述

  1. 三级抽象

数据库系统划分为三个抽象级:用户级、概念级、物理级

  • 用户级数据库:对应于外模式,是最接近用户的一级数据库,是用户可以看到和使用的数据库,又称为用户视图。用户级数据库主要由外部记录组成,不同的用户视图可以互相重叠,用户的所有操作都是针对用户视图进行的。
  • 概念级数据库:对应于概念模式,是所有用户视图的最小并集,是数据库管理员可看到和使用的数据库,又称为DBA(DataBase Administrator ,数据库管理员)视图。概念级数据库由概念记录组成,一个数据库可有多个不同的用户视图,每个用户视图由数据库某一部分的抽象表示所组成。一个数据库应用系统只存在一个DBA视图,它把数据库作为一个整体的抽象表示。概念级模式把用户视图有机地结合成一个整体,综合平衡考虑所有用户要求,实现数据的一致性、最大限度降低数据冗余、准确地反映数据间的联系。
  • 物理级数据库:对应于内模式,是数据库的底层表示,描述数据的实际存储组织,是最接近于物理存储的级,又称为内部视图。物理级数据库由内部记录组成,物理级数据库并不是真正的物理存储,而是最接近于物理存储的级
  1. 三级模式
  • 外模式:用以描述用户看到或使用的那部分数据的逻辑结构,用户根据外模式用数据操作语句或应用程序去操作数据库中的数据。一个数据库可以有多个外模式,一个应用程序只能使用一个外模式
  • 概念模式:用以描述整个数据库中数据库的逻辑结构,描述现实世界中的实体及其性质与联系,定义记录、数据项、数据的完整性约束条件及记录之间的联系,是数据项值的框架,是所有用户的公共数据视图。一个数据库只有一个概念模式
  • 内模式:是数据物理结构和存储方式的描述,是数据在数据库内部的表示方式。一个数据库只有一个内模式

三者之间的关系:

  • 概念模式是数据库的中心与关键
  • 内模式依赖于概念模式,独立于外模式和存储设备;
  • 外模式面向具体的应用,独立于内模式和存储设备;
  • 应用程序依赖于外模式,独立于内模式和概念模式。
  1. 两级独立性

是指物理独立性和逻辑独立性。三个抽象级间通过两级映射(外模式-概念模式映射、概念模式-内模式映射)进行相互转换,使得数据库的三级形成一个统一的整体。

  • 物理独立性:指用户的应用程序与存储在磁盘上的数据库中的数据是相互独立的。当数据的物理存储改变时,应用程序不需要改变。存在于概念模式-内模式之间的映射转换,说明物理组织发生变化时应用程序的独立程度。
  • 逻辑独立性:指用户的应用程序与数据库中的逻辑结构是相互独立的。当数据的逻辑结构改变时,应用程序不需要改变。存在于外模式-概念模式之间的映射转换,说明概念模式发生变化时应用程序的独立程度。

ps:逻辑独立性比物理独立性更难实现。

数据模型

数据模型主要有2大类,分别是概念数据模型(实体-联系模型) 和 基本数据模型(结构数据模型)

  • 概念数据模型:按照用户的观点来对数据和信息建模,主要用于数据库设计。概念数据模型主要用实体-联系方法(Entity-Relationship Approach)表示,所以也称为E-R模型
  • 基本数据模型:按照计算机系统的观点来对数据和信息建模,主要用于数据库管理系统(Database Management System,DBMS)实现。基本数据模型是数据库系统的核心和基础,通常由数据结构、数据操作和完整性约束三部分组成。其中 数据结构是对系统静态特性的描述,数据操作是对系统动态特性的描述,完整性约束是一组完整性规则的集合。常用的有:层次模型、网状模型、关系模型、面向对象模型。

ps:关系模型常用,用表格结构表达实体集,用外键表示实体间的联系。优点有:

  1. 建立在严格的数据概念基础上;
  2. 概念(关系)单一,结构简单、清晰,用户易懂易用;
  3. 存取路径对用户透明,从而数据独立性、安全性好,简化数据库开发工作。

关系代数

在这里插入图片描述

  • 笛卡尔积: 对R和S 做笛卡尔积运算,结果如下:
    在这里插入图片描述

  • 投影:从一个关系中抽取指明的属性(列)。对表3-1 关系R做投影操作,p1,2( R) 的结果如下:
    注意:p1,2( R) 操作表示对第1列和第2列做投影。
    在这里插入图片描述

  • 选择在这里插入图片描述
    注意:选择运算是从元组(行)的角度进行的运算。

  • 等值连接/自然连接
    在这里插入图片描述


  • 在这里插入图片描述

ps :
笛卡尔积:就是把表的记录都一一组合
投影:以列为单位,选择不重复的行
选择:以行为单位,选择行
等值连接:以相同列等值,选择行
自然连接:在等值连接基础上,并在结果中将重复的属性去掉
除:如果表A 和表B 做除法,先确定XYZ,Y和Z 一样,选择A和B 公共部分为YZ,然后A除去公共部分的就是X,然后对X进行投影操作,获取的结果X’与Z进行笛卡尔积操作,如果结果包含在A 中,则X’为最终结果

数据的规范化

关系模型满足的确定约束条件称为范式把一个低一级的关系模型分解为高一级关系模型的过程,称为关系模型的规范化规范化的思想是:逐步消除不合适的函数依赖,使数据库中的各个关系模型达到某种程度的分离关系模型分解必须遵守2个准则

  • 无损连接性: 信息不失真(不增减信息);
  • 函数依赖保持性:不破坏属性间存在的依赖关系。

范式从低到高分为1NF(第一范式)、2NF(第二范式)、3NF(第三范式)、BCNF(BC范式)、4NF(第四范式)等。

  • 第一范式:元素不可再分,如以下例子。但是满足了1NF会有很多重复值,并且增加了修改其数据时引起疏漏的可能性。为了消除这种数据冗余和避免更新数据的遗漏,需要更规范的2NF。
    在这里插入图片描述

  • 第二范式:如果一个关系R属于1NF,且所以的非主属性都完全依赖于主属性,则称为第二范式。

  • 第三范式:如果一个关系R属于2NF,且每个非主属性不传递依赖于主属性,则称为第三范式。

  • BC范式:一般满足3NF的关系模型已能消除冗余和各种异常现象,但无论2NF和3NF 都没有涉及主属性间的函数依赖,所以有时仍会引起一些问题,由此引入BC范式,通常也认为是3NF的改进。其定义是:每个函数依赖关系中的决定因素都包含码,即主属性都有外键和主键。

反规范化

优点是减少数据冗余,节约存储空间,相应逻辑和物理的I/O次数减少,同时加快了增、删、改的速度,但对完全规范的数据库查询,通常需要更多的连接操作,从而影响查询速度。因此,有时为了提高某些查询或应用的性能而破坏规范规则,即反规范化(非规范化处理)。

数据库设计

事务管理

备份与恢复

分布式数据库系统

数据仓库

数据挖掘

NoSQL

大数据

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.mfbz.cn/a/802480.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

Linux - 冯-诺依曼体系结构、初始操作系统

目录 冯•诺依曼体系 结构推导 内存提高效率的方法 数据的流动过程 体系结构相关知识 初始操作系统 定位 设计目的 操作系统之上之下分别有什么 管理精髓:先描述,再组织 冯•诺依曼体系 结构推导 计算机基本工作流程图大致如下: 输入设备&a…

vscode 打开远程bug vscode Failed to parse remote port from server output

vscode 打开远程bug vscode Failed to parse remote port from server output 原因如图: 解决:

【数学建模】技术革新——Lingo的使用超详解

目录 基础知识 1. 变量声明 示例 2. 常量声明 语法格式 示例 3. 目标函数 语法格式 示例 4. 约束条件 语法格式 示例 5. 完整的Lingo模型示例 示例 解释 6. 整数变量声明 语法格式 示例 7. 非线性规划 示例 8. 多目标优化 语法格式 示例 9. 数据输入与…

TypeScript 函数类型 (二)

函数类型 函数有两种方式定义 function 关键字来定义函数 function a(){}表达式定义(箭头函数的形式) const a()>{}函数需要定义类型的有三个地方 入参 和 返回值 以及 函数本身 的类型, 函数本身的类型常用于表达式定义的函数 function sum(a:stri…

洛谷 P1056 [NOIP2008 普及组 T2]:排座椅 ← 贪心算法

【题目来源】https://www.luogu.com.cn/problem/P1056https://www.acwing.com/problem/content/436/【题目描述】 上课的时候总有一些同学和前后左右的人交头接耳,这是令小学班主任十分头疼的一件事情。 不过,班主任小雪发现了一些有趣的现象&#xff0c…

Ubuntu Desktop Docker 配置代理

Ubuntu Desktop Docker 配置代理 主要解决 docker pull 拉取不了镜像问题. Docker Desktop 配置代理 这个比较简单, 直接在 Docker Desktop 里设置 Proxies, 示例如下: http://127.0.0.1:7890 Docker Engine 配置代理 1.Docker Engine 使用下面配置文件即可, root 用户可…

Git的基础操作

环境:Linux操作系统-Centos 创建本地仓库 首先创建一个目录,命名为:gitcode mkdir gitcode进入gitcode目录,创建本地仓库 git init此时,就会创建出了一个空的仓库在当前目录下了,此时目录下就有git的目录了 配置Git 首先重要的…

科技出海|百分点科技智慧政务解决方案亮相非洲展会

近日,华为非洲全联接大会在南非约翰内斯堡举办,吸引政府官员行业专家、思想领袖、生态伙伴等2,000多人参会,百分点科技作为华为云生态合作伙伴,重点展示了智慧政务解决方案,发表《Enable a Smarter Government with Da…

which 命令在Linux中是一个快速查找可执行文件位置的工具

文章目录 0、概念1、which --help2、which命令解释 0、概念 which命令用于查找命令的可执行文件的路径which 命令在 Linux 中用于查找可执行命令的完整路径。当你在 shell 中输入一个命令时,shell 会在环境变量 $PATH 定义的目录列表中查找这个命令。which 命令可以…

【Neural signal processing and analysis zero to hero】- 1

The basics of neural signal processing course from youtube: 传送地址 Possible preprocessing steps Signal artifacts (not) to worry about doing visual based artifact rejection so that means that before you start analyzing, you can identify those data epic…

SQL Server Query Store Settings (查询存储设置)

参考:Query Store Settings - Erin Stellato 在 SQL Server 2017 中,有九 (9) 个设置与查询存储相关。虽然这些设置记录在sys.database_query_store_options中,但我经常被问到每个设置的值“应该”是多少。我在下面列出了每个设置&am…

[Vulnhub] devt-improved slog_users+vim权限提升+nano权限提升+passwd权限提升+Lxc逃逸权限提升

信息收集 IP AddressOpening Ports192.168.101.149TCP:22,113,139,445,8080 $ nmap -p- 192.168.101.149 --min-rate 1000 -sC -sV PORT STATE SERVICE VERSION 22/tcp open ssh OpenSSH 7.6p1 Ubuntu 4 (Ubuntu Linux; protocol 2.0) | ssh-hostkey: | …

【GPT4充值】WildCard虚拟卡

绑定流程 官网:WildCard | 一分钟注册,轻松订阅海外软件服务 1、使用手机号验证码注册、可以使用zfb快捷认证 2、填写身份信息后,然后根据流程验证即可。 3、选择卡片使用期限,填入邀请码【PEACEFUL】可立减$2。 4、打开openAI开发…

leetcode热题100.分割等和子集(动态规划)

分割等和子集 Problem: 416. 分割等和子集 思路 我选择使用动态规划的方法来解题。我们需要判断是否可以将数组分割成两个子集,使得这两个子集的和相等。这个问题可以转化为在数组中找到一个子集,使得其和等于数组总和的一半。 解题过程 首先&#xf…

卷积神经网络-猫狗识别实战

课程来自bilibiliMomodel平台 全长只有两个小时,理论部分讲得很粗糙 1 人的视觉和计算机视觉 人的大脑:神经元细胞,轴突发送信号,树突接收信号,互相连接,连接的强度和状态会随着新的经历刺激而变化。 用…

GitHub+Picgo图片上传

Picgo下载,修改安装路径,其他一路下一步! 地址 注册GitHub,注册过程不详细展开,不会的百度一下 地址 新建GitHub仓库存放图片 ——————————————————————————————————————————…

【贪心算法】贪心算法30题

一、贪心算法简介 证明贪心策略正确性的常用方法:直接证明、交换论证法、反证法、分类讨论… 二、相关编程题 2.1 柠檬水找零 题目链接 860. 柠檬水找零 - 力扣(LeetCode) 题目描述 算法原理 提示:最优解和贪心解唯一可能不同…

Java IO流(详解)

目录 1.概述 2.File文件类 2.1 文件的创建操作 2.2 文件的查找操作 3. File里面一些其他方法 3.1 经典案例 4. IO流 4.1 概念 4.2 IO分类 4.3 字节输出流 4.4 字节输入流 4.5 案例 4.6 字符输出流 4.7 字符输入流 4.8 案例 4.9 处理流--缓冲流 4.10 对象流: 1.…

IP地址定位与智慧城市和智能交通

智慧城市和智能交通是现代城市发展的关键领域,通过先进技术提升城市管理和居民生活质量。IP地址定位在交通监控、智能路灯管理等方面发挥了重要作用,本文将深入探讨其技术实现及应用。 交通监控与优化 通过IP地址连接交通传感器和摄像头,可…

useState函数

seState是一个react Hook(函数),它允许我们像组件添加一个状态变量,从而控制影响组件的渲染结果 数据驱动试图 本质:和普通JS变量不同的是,状态变量一旦发生变化组件的视图UI也会随着变化(数据驱动试图) 使用 修改状态 注意&am…