PostgreSQL 简洁、使用、正排索引与倒排索引、空间搜索、用户与角色

PostgreSQL使用

  • PostgreSQL 是一个免费的对象-关系数据库服务器(ORDBMS),在灵活的BSD许可证下发行。
  • PostgreSQL 9.0 :支持64位windows系统,异步流数据复制、Hot Standby;
  • 生产环境主流的版本是PostgreSQL 12

BSD协议 与 GPL协议

BSD协议:可以自由的使用,修改源代码,也可以将修改后的代码作为开源或者专有软件再发布。
GPL协议:某软件使用了GPL软件,那么该软件也需要开源,如果不开源,就不能使用GPL软件。MySQL被Oracle所控制,MySQL使用了GPL

PostgreSQL与MySQL的比较

  • PG的索引类型比MySQL种类多;
  • PG的主备复制属于物理复制,相对于MySQL基于binlog的逻辑复制
  • PostgreSQL完全免费,而且是BSD协议, MySQL是GPL协议,被Oracle控制;
  • PG主表采用堆表存放,MySQL采用索引组织表,能够支持比MySQL更大的数据量。
    总结来说, PostgreSQL适合严格的企业场景, MySQL更加适合业务逻辑相对简单、数据可靠性要求较低的互联网场景(比如google、facebook、alibaba)

Windows下的PostgreSQL的下载

下载地址:PostgreSQL下载

  1. 点击exe文件,弹出
    在这里插入图片描述

  2. 可以修改安装路径
    在这里插入图片描述

  3. 选择安装组件,不懂的选就是全部勾上:
    在这里插入图片描述

  4. 设置数据库的数据路径‘
    在这里插入图片描述

  5. 设置超级用户的密码
    在这里插入图片描述

6.设置端口号,可以直接用默认就行
在这里插入图片描述
6. 直接点 Next,直到以下图,取消勾选;
在这里插入图片描述

  1. 打开 pgAdmin 4
    在这里插入图片描述
  2. 点击左侧的 Servers > Postgre SQL 10
    在这里插入图片描述
    输入密码,点击 OK 即可

在这里插入图片描述
9. 打开 SQL Shell(psql)
![在这里插入图片描述](https://img-blog.csdnimg.cn/32f8f25a7f8547c7ad463abc4a24db5b.png
在这里插入图片描述

PostgreSQL远程访问

  1. 打开postgresql安装目录的data子目录
    在这里插入图片描述

  2. 修改pg_hba.conf文件:在IPV4部分添加新的一行:host all all 0.0.0.0/0 md5
    在这里插入图片描述

  3. 控制面板–>系统与安全–>Windows防火墙,关闭防火墙,重启服务;

  • 业务开发中,大部分还是通过客户端连接工具操作PostgreSQL,通过命令行操作的方式还是很少, 我用的是navicat。
  • 远程访问连接问题可能会有多种,大部分百度都可以解决;

PostgreSQL的基本使用

登录

业务中,我们用navicat连接居多,很少会用命令行连接;

psql -U dbuser -d exampledb -h 127.0.0.1 -p 5432

数据库操作

#创建数据库
CREATE DATABASE mydb;

#查看所有数据库
\l

#切换当前数据库
\c mydb


#删除数据库
drop database <dbname>

数据库表操作

表字段类型

  1. 整数型
  • smallint :2 字节, 小范围整数,范围-32768 到 +32767
  • integer:4 字节,常用的整数,范围 -2147483648 到 +2147483647
  • bigint:8 字节 大范围整数,范围-9223372036854775808 到 +9223372036854775807
  • decimal :可变长 用户指定的精度,精确 小数点前 131072 位;小数点后 16383 位
  • numeric 可变长 用户指定的精度,精确 小数点前 131072 位;小数点后 16383 位
  • double:8 字节 可变精度,不精确 15 位十进制数字精度

业务中一般不用double, 最好用decimal,避免出现精度误差问题;

  1. 字符型
  • char(size),character(size):固定长度字符串,size 规定了需存储的字符数,由右边的空格补齐
  • varchar(size),character varying(size):可变长度字符串,size 规定了需存储的字符数;
  • text:可变长度字符串。
  1. 时间型
  • timestamp:日期和时间;
  • date:日期,无时间;
  • time:时间;

主要就是这几种,还有几何,布尔类型等,常见是以上三种;

表操作

业务中,创建表的操作,应该是通过可视化客户端工具创建;


#创建表
CREATE TABLE test(id int,body varchar(100));

#在表中插入数据
insert into test(id,body) values(1,'hello,postgresql');

#查看当前数据库下所有表
\d

#查看表结构,相当于desc
\d test

主键相关:PostgreSQL 使用序列来标识字段的自增长,数据类型有 smallserial、serial 和 bigserial 。这些属性类似于 MySQL 数据库支持的 AUTO_INCREMENT 属性。

  • SMALLSERIAL : 2字节,范围:1到 32767
  • SERIAL: 4字节,范围:1 到 2,147,483,647
  • BIGSERIAL: 8字节,范围1 到 922,337,2036,854,775,807
#创建表
CREATE TABLE COMPANY(
   ID  SERIAL PRIMARY KEY,
   NAME           TEXT      NOT NULL,
   AGE            INT       NOT NULL,
   ADDRESS        CHAR(50),
   SALARY         REAL
);

#插入数据
INSERT INTO COMPANY (NAME,AGE,ADDRESS,SALARY)
VALUES ( 'Paul', 32, 'California', 20000.00 );

INSERT INTO COMPANY (NAME,AGE,ADDRESS,SALARY)
VALUES ('Allen', 25, 'Texas', 15000.00 );
#查询SQL
SELECT * FROM COMPANY where id = 1;
# 更新SQL
UPDATE COMPANY SET  age = 33 where id = 1;

PostgreSQL的语法基本和MySQL差不多, 业务开发中,一般都是写curd, 而建表等操作,通过可视化工具执行效率更高效;

Schema

PostgreSQL 模式(SCHEMA)可以看着是一个表的集合。
一个模式可以包含视图、索引、数据类型、函数和操作符等。
相同的对象名称可以被用于不同的模式中而不会出现冲突,例如 schema1 和 myschema 都可以包含名为 mytable 的表。
使用模式的优势:
● 允许多个用户使用一个数据库并且不会互相干扰。
● 将数据库对象组织成逻辑组以便更容易管理。
● 第三方应用的对象可以放在独立的模式中,这样它们就不会与其他对象的名称发生冲突。
模式类似于操作系统层的目录,但是模式不能嵌套。

#创建schema: 
create schema myschema;

create table myschema.company(
   ID   INT              NOT NULL,
   NAME VARCHAR (20)     NOT NULL,
   AGE  INT              NOT NULL,
   ADDRESS  CHAR (25),
   SALARY   DECIMAL (18, 2),
   PRIMARY KEY (ID)
);

#删除schema: 
drop schema myschema;

#删除一个模式以及其中包含的所有对象:
DROP SCHEMA myschema CASCADE;

在这里插入图片描述
结构如上,创建了schema之后,可以在两个schema中创建同名的表, 类似库中库的感觉;

数据表的索引

唯一索引 与 普通索引

CREATE UNIQUE INDEX "idx_dev_id_user_id" ON "myschema"."device" USING btree (
  "deviceid",
  "userid"
)

psql普通索引:

CREATE INDEX "id_dev_id" ON "myschema"."device" USING btree (
  "deviceid"
)

索引底层使用的是Btree结构, 是排好序的结构,通过树的遍历快速找到目标结果,大大减少IO次数;
若不使用索引,则进行全表扫描;

树结构如图所示:
在这里插入图片描述

哈希索引

通过哈希表结构存储数据, 存储数据时, 对查询条件进行hash,得到哈希码后,再从哈希表中拿到目标值,缺点是只能支持 =, in查询, 不支持范围查询;

CREATE INDEX "idx_name" ON "myschema"."person" USING hash (
  "name"
)

在这里插入图片描述
业务开发中,基本不会使用到这个索引,业务中很多场景都需要进行模糊搜索,范围搜索,而哈希索引是支持不了的;

倒排索引

  • Generalized Inverted Index, 简称gin;
  • 它处理的数据类型的值不是原子的,而是由元素组成的。
  • GIN索引由元素的B树组成,TID的B树或平面列表链接到该B树的叶行。
  • 使用于全文搜索场景,解决全文搜索性能低问题;
  • 可解决like “%xxx%” 索引失效问题;
  1. 增加pg_trgm拓展
CREATE EXTENSION pg_trgm;
  1. 给字段建立索引
CREATE INDEX "idx_addres" ON "myschema"."person" USING gin (
  "address"
)

正排索引

整个key是索引, value是整行记录;
例如 搜索name为"zhangsan", value为“zhangsan”整条记录;
正排索引的key是 “zhangsan”, value保存整条记录;

对应ID主键索引,普通索引,唯一索引,是正排索引;
在这里插入图片描述

倒排索引

  • 倒排表以字或词为关键字进行索引,表中关键字所对应的记录表项记录了出现这个字或词的所有文档,一个表项就是一个字表段,它记录该文档的ID和字符在该文档中出现的位置情况。

  • 由于每个字或词对应的文档数量在动态变化,所以倒排表的建立和维护都较为复杂,但是在查询的时候由于可以一次得到查询关键字所对应的所有文档,所以效率高于正排表。

  • 在全文检索中,检索的快速响应是一个最为关键的性能,而索引建立由于在后台进行,尽管效率相对低一些,但不会影响整个搜索引擎的效率。

  • 倒排表的结构图如下图
    在这里插入图片描述

  • GIN(Generalized Inverted Index, 通用倒排索引)是一个存储对(key, posting list)集合的索引结构,其中key是一个键值,而posting list 是一组出现过key的位置。如(‘hello’, ’14:2 23:4’)中,表示hello在14:2和23:4这两个位置出现过,在PG中这些位置实际上就是元组的tid。

  • 在表中的每一个属性,在建立索引时,都可能会被解析为多个键值,所以同一个元组的tid可能会出现在多个key的posting list中。

  • 通过这种索引结构可以快速的查找到包含指定关键字的元组,因此GIN索引特别适用于支持全文搜索,而PG的GIN索引模块也就是为了支持全文搜索而开发的。

psql gist索引

  • Gist(Generalized Search Tree),即通用搜索树。和btree一样,也是平衡的搜索树
  • Btree用于等值、范围搜索;
  • 生活部分场景中,需要存储多维数据,例如地理位置、空间位置、图像数据等,经常要判断是否在 某个位置, 某个点的数据,我即判断地理位置的"包含"那么我们就可以使用gist索引了

使用场景

  1. 几何类型,支持位置搜索,按距离排序。
  2. 范围类型,支持位置搜索。
  3. 空间类型(PostGIS),支持位置搜索,按距离排序。
    其场景暂时没想到;

简单使用

1.创建一张测试表:

create table company(id int, location point);    

在这里插入图片描述
2. 给location设置索引

CREATE INDEX "idx_location" ON "myschema"."company " USING gist (
  "location"
)
  1. 添加随机插入10万条数据
insert into company select generate_series(1,100000), point(round((random()*1000)::numeric, 2), round((random()*1000)::numeric, 2));  
  1. 查询
select * from company where circle '((100,100) 50)'  @> location;    

把坐标(100,100) 上下50范围内的数据全找出来, 结果如下,
在这里插入图片描述

使用explain查看执行计划:

explain (analyze,verbose,timing,costs,buffers) select * from company where circle '((100,100) 50)'  @> location;

在这里插入图片描述

再查看分页的执行计划;

explain (analyze,verbose,timing,costs,buffers) select * from company where circle '((100,100) 50)'  @> location ORDER BY id  limit  10 OFFSET 11;

在这里插入图片描述
出现了Bitmap index scan, Bitmap heap scan, sort三种;

分页搜索场景

业务开发中,搜索经常会涉及到分页操作,而PostgreSQL和MySQL不太一致, 不是使用limit xxx, xxx, 而是使用了limit xx offset xx;
例如一页10条数据, 搜索第一页:

select * from company where circle '((100,100) 50)'  @> location ORDER BY id  limit  10 OFFSET 1;

在这里插入图片描述
第二页则是 第11条值20条

select * from company where circle '((100,100) 50)'  @> location ORDER BY id  limit  10 OFFSET 11;

在这里插入图片描述

用户操作

#创建用户并设置密码
CREATE USER 'username' WITH PASSWORD 'password';
CREATE USER test WITH PASSWORD 'test';

#修改用户密码
$ ALTER USER 'username' WITH PASSWORD 'password';

#数据库授权,赋予指定账户指定数据库所有权限
$ GRANT ALL PRIVILEGES ON DATABASE 'dbname' TO 'username';
#将数据库 mydb 权限授权于 test
GRANT ALL PRIVILEGES ON DATABASE mydb TO test;
#但此时用户还是没有读写权限,需要继续授权表
GRANT ALL PRIVILEGES ON ALL TABLES IN SCHEMA public TO xxx;
#注意,该sql语句必须在所要操作的数据库里执行

#移除指定账户指定数据库所有权限
REVOKE ALL PRIVILEGES ON DATABASE mydb from test

#删除用户
drop user test

# 查看用户
\du

pg_hba.conf配置中的第一项设置的意思是:本地用户通过unix socket登陆时,使用peer方式认证。

# "local" is for Unix domain socket connections only
local   all             all                                     peer
  • peer是用PostgreSQL所在的操作系统上的用户登陆。
    peer方式中,client必须和PostgreSQL在同一台机器上。只要当前系统用户和要登陆到PostgreSQL的用户名相同,就可以登陆。
    在刚部署PostgreSQL之后,切换到系统的postgres用户后,直接执行psql就能进入PostgreSQL就是这个原因(当前系统用户为名postgre,PostgreSQL中的用户名也是postgre)。

PostgreSQL 角色管理

在PostgreSQL 里没有区分用户和角色的概念,“CREATE USER” 为 “CREATE ROLE” 的别名,这两个命令几乎是完全相同的,唯一的区别是"CREATE USER" 命令创建的用户默认带有LOGIN属性,而"CREATE ROLE" 命令创建的用户默认不带LOGIN属性

postgres=# CREATE ROLE david;  //默认不带LOGIN属性
CREATE ROLE
postgres=# CREATE USER sandy;  //默认具有LOGIN属性
CREATE ROLE
postgres=# \du
                             List of roles
 Role name |                   Attributes                   | Member of 
-----------+------------------------------------------------+-----------
 david     | Cannot login                                   | {}
 postgres  | Superuser, Create role, Create DB, Replication | {}
 sandy     |                                                | {}

postgres=# 
postgres=# SELECT rolname from pg_roles ;
 rolname  
----------
 postgres
 david
 sandy
(3 rows)

postgres=# SELECT usename from pg_user;         //角色david 创建时没有分配login权限,所以没有创建用户
 usename  
----------
 postgres
 sandy
(2 rows)

postgres=#

更新权限;

postgres=# ALTER ROLE bella WITH LOGIN;
ALTER ROLE
postgres=# \du
                             List of roles
 Role name |                   Attributes                   | Member of 
-----------+------------------------------------------------+-----------
 bella     | Create DB                                      | {}
 david     |                                                | {}
 postgres  | Superuser, Create role, Create DB, Replication | {}
 renee     | Create DB                                      | {}
 sandy     |                                                | {}

postgres=#

角色属性

  • login:只有具有 LOGIN 属性的角色可以用做数据库连接的初始角色名。
  • superuser: 数据库超级用户
  • createdb: 创建数据库权限
  • createrole: 允许其创建或删除其他普通的用户角色(超级用户除外)
  • password: 在登录时要求指定密码时才会起作用,比如md5或者password模式,跟客户端的连接认证方式有关
  • replication: 做流复制的时候用到的一个用户属性,一般单独设定。

命令行模式下的常用命令

\password命令(设置密码)
\q命令(退出)
\h:查看SQL命令的解释,比如\h select。
\?:查看psql命令列表。
\l:列出所有数据库。
\c [database_name]:连接其他数据库。
\d:列出当前数据库的所有表格。
\d [table_name]:列出某一张表格的结构。
\du:列出所有用户。

总结

  1. PostgreSQL 功能比MySQL强大一些, 语法上接近, crud学起来很快;
  2. 同样拥有唯一索引,普通索引,哈希索引, 另外多了GIN,GIST索引的新特性, 业务场景更加广泛了;
  3. oracle是要钱的, PostgreSQL是免费的, 未来严格的企业场景中,Oracle占比会越来越少,逐渐被PostgreSQL替代;
  4. Mysql + PostgreSQL 以后是潮流,开发者必须要懂这两块;
  5. 以后还有进阶内容,需要不断学习;

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:/a/50810.html

如若内容造成侵权/违法违规/事实不符,请联系我们进行投诉反馈qq邮箱809451989@qq.com,一经查实,立即删除!

相关文章

TypeScript -- 类

文章目录 TypeScript -- 类TS -- 类的概念创建一个简单的ts类继承 public / private / protected-- 公共/私有/受保护的public -- 公共private -- 私有的protected -- 受保护的 其他特性readonly -- 只读属性静态属性 -- static修饰ts的getter /setter抽象类abstract TypeScrip…

【深入理解NAND Flash】 闪存(NAND Flash) 学习指南

依公开知识及经验整理&#xff0c;付费内容&#xff0c;禁止转载。 所在专栏 《深入理解Flash:闪存特性与实践》 1. 我想和你说 漠然回首&#xff0c;从事存储芯片行业已多年&#xff0c;这些年最宝贵的青春都献给了闪存&#xff0c;虽不说如数家珍&#xff0c;但也算专业。 …

Nginx下载、安装与使用

Nginx下载 简介&#xff1a; Nginx是一个高性能的HTTP和反向代理web服务器&#xff0c;同时也提供了IMAP/POP3/SMTP服务&#xff08;邮件服务&#xff09;。 官网下载地址&#xff1a; https://nginx.org/en/download.html 国内镜像地址&#xff1a; https://mirrors.huawe…

华为云NFS使用API删除大文件目录

最近在使用华为云SFS时&#xff0c;如果一个目录存储文件数超过100W&#xff0c;执行 “rm -rf path”时&#xff0c;存在删不动的情况&#xff0c;可以使用华为云API接口&#xff0c;执行异步删除。 华为官网&#xff1a; 删除文件系统目录_弹性文件服务 SFS_API参考_SFS Tu…

Redis入门

一、Redis的安装 Redis的官方文档介绍了多种安装方式(包括Linux、Windows、MacOs平台上的安装和从源码包安装)&#xff1a;Redis安装。这里只介绍源码安装方式。 下载源码包 $ wget https://download.redis.io/redis-stable.tar.gz编译Redis $ tar -xzvf redis-stable.tar.gz …

Linux下进程特性总结:工作目录,环境变量,标准输出转命令行参数,O_CLOEXEC标志作用,读写锁控制进程互斥

进程是运行中的程序&#xff0c;是资源分配的最小单位&#xff0c;其有一些特性对于实际开发很有帮助&#xff0c;本篇博客将进程的相关特性进行梳理总结&#xff0c;包含工作目录&#xff0c;环境变量&#xff0c;标准输出转命令行参数&#xff0c;读写锁控制进程互斥。 目录…

MyBatis学习笔记之缓存

文章目录 一级缓存一级缓存失效 二级缓存二级缓存失效二级缓存相关配置 MyBatis集成EhCache 缓存&#xff1a;cache 缓存的作用&#xff1a;通过减少IO的方式&#xff0c;来提高程序的执行效率 mybatis的缓存&#xff1a;将select语句的查询结果放到缓存&#xff08;内存&…

Pytorch深度学习-----神经网络的卷积操作

系列文章目录 PyTorch深度学习——Anaconda和PyTorch安装 Pytorch深度学习-----数据模块Dataset类 Pytorch深度学习------TensorBoard的使用 Pytorch深度学习------Torchvision中Transforms的使用&#xff08;ToTensor&#xff0c;Normalize&#xff0c;Resize &#xff0c;Co…

IDEA将本地项目上传到码云

一、创建本地仓库并关联 用IDEA打开项目&#xff0c;在菜单栏点击vcs->create git repository创建本地仓库&#xff0c; 选择当前项目所在的文件夹当作仓库目录。 二、将项目提交本地仓库 项目名右键就会出现“GIT”这个选项->Add->Commit Directory, 先将项目add…

【嵌入式学习笔记】嵌入式基础11——STM32常用轮子(SYSTEM)

1.deley文件夹介绍 1.1.delay文件夹介绍 函数名函数功能OSdelay_osschedlockus级延时时,关闭任务调度(防止打断us级延迟)OSdelay_osschedunlockus级延时时,恢复任务调度OSdelay_ostimedlyus级延时时,恢复任务调度OSSysTick_Handlersystick中断服务函数OSdelay_init初始化延迟…

【学习笔记】关于图像YUV格式分类和排布方式的全学习

这里是尼德兰的喵学习笔记相关文章&#xff0c;欢迎您的访问&#xff01; 如果文章对您有所帮助&#xff0c;期待您的点赞收藏 让我们一起为芯片前端全栈工程师而努力 目录 前言 YUV格式导图 YUV444 packed planar I444 YV24 semi-planar NV24 NV42 YUV422 packed …

c++静态代码扫描工具clang-tidy详细介绍

clang-tidy 文章目录 clang-tidy1. 什么是clang-tidy2. clang-tidy可以解决什么问题3. 工作原理4. 如何使用clang-tidy4. 总结5. 举例说明&#xff1a; 1. 什么是clang-tidy Clang-Tidy是一个由LLVM项目提供的开源工具&#xff0c;是一个静态分析工具&#xff0c;用于进行静态…

【雕爷学编程】MicroPython动手做(15)——掌控板之AB按键3

知识点&#xff1a;什么是掌控板&#xff1f; 掌控板是一块普及STEAM创客教育、人工智能教育、机器人编程教育的开源智能硬件。它集成ESP-32高性能双核芯片&#xff0c;支持WiFi和蓝牙双模通信&#xff0c;可作为物联网节点&#xff0c;实现物联网应用。同时掌控板上集成了OLED…

win10日程怎么同步到安卓手机?电脑日程同步到手机方法

在如今快节奏的生活中&#xff0c;高效地管理时间变得至关重要。而对于那些经常在电脑上安排日程的人来说&#xff0c;将这些重要的事务同步到手机上成为了一个迫切的需求。因为目前国内使用win10系统电脑、安卓手机的用户较多&#xff0c;所以越来越多的职场人士想要知道&…

macos下安装john the ripper并配置zip2john+破解加密zip文件

为了破解加密的zip文件&#xff0c;需要用到john进行爆破密码。 1、首先使用homebrew安装john&#xff0c;可以安装它的增强版john-jumbo: brew install john-jumbo 2、安装后可以使用 john 命令验证&#xff1a; john 3、配置zip2john的环境——.zshrc下&#xff0c;&#x…

HashMap查找

文章目录 1 哈希表的基本概念1.1 两个例子1.2 如何查找1.3 若干术语 2 哈希函数的构造方法2.1 直接定址法2.2 除留余数法 3 处理冲突的方法3.1 开放地址法3.1.1 线性探测法3.1.2 二次探测法3.1.3 伪随机探测法 3.2 链地址法&#xff08;拉链法&#xff09;3.2.1 创建步骤3.2.2 …

C#..上位机软件的未来是什么?

C#是一种流行的编程语言&#xff0c;广泛应用于桌面应用程序和上位机软件开发。未来&#xff0c;C#上位机软件将继续不断发展和创新&#xff0c;以满足用户日益增长的需求。以下是我认为C#上位机软件未来可能会涉及的一些方向&#xff1a; 更加智能化&#xff1a;随着人工智能…

idea连接远程服务器上传war包文件

idea连接远程服务器&上传war包 文章目录 idea连接远程服务器&上传war包1. 连接服务器2.上传war包 1. 连接服务器 选择Tools -> Start SSH Session 添加配置 连接成功 2.上传war包 Tools -> Deployment -> Browse Remote Host 点击右侧标签&#xff0c;点击&…

Manjaro KDE 22.1.3vmware无法复制文件

Wayland 是 X11 的现代替代品&#xff0c;几十年来 X11 一直是 Linux 上的默认窗口系统。 Wayland 是一种通信协议&#xff0c;定义 X Window 显示服务器和客户端应用程序之间的消息传递。 软件还不兼容 使用X11即可

linux查看服务器系统版本命令

有时我们需要在linux服务器上安装DB、Middleware等&#xff0c;为了保证兼容性&#xff0c;我们需要知晓被提供的linux服务器版本是否满足需求&#xff0c;下面就说一说linux查看服务器系统版本命令。 1.cat /etc/redhat-release 适用于&#xff1a;rhel/centos等 2.cat /etc…