最近看到数据库圈子内很多朋友都在宣传PostgreSQL,不可否则,这几年PostgreSQL在国内还是比较火,相反MySQL似乎大家宣传的还少一些了。
老实说我个人对PostgreSQL没有太大的好感,虽然知道PostgreSQL功能很强大,用过一段时间,总感觉用起来比较别扭。当然,可能根本原因还是自己不太熟。
这几年主要研究国产数据库多一些,在我们这么多的国产化改造客户中来看,实际上PostgreSQL的比例是比较低的,目前也就能源、医疗、制造业行业客户有在少量使用。
首先我要说的是国产数据库这么多种,实际上有不少都是基于PostgreSQL的,这其中有完全套壳的,也有基于PostgreSQL去魔改的,具体的名字就提了,我相信很多网友都知道了。 要说For PG 兼容性,MogDB 其实做的点很多了,这类我挑选一部分供大家参考。
兼容PostgreSQL scroll属性
MogDB 5.0版本在A模式或PG模式,可以对游标指定SCROLL属性,使其可用于倒序方式检索数据行(即反向检索)。
兼容PostgreSQL 表级logged/unlogged属性
默认logged属性的表有WAL写保护,不会有数据丢失的风险。不过unlogged属性的表不记录WAL性能更高,不同场景用户可以灵活选择,进行切换使用。 MogDB 5.0版本在PG兼容模式下支持在线切换表的logged/unlogged属性,并且同时兼容两种用法,且与PostgreSQL操作一样。
CREATE TABLE tab1 (...);
ALTER TABLE tab1 SET UNLOGGED ;
ALTER TABLE tab1 SET LOGGED ;
不过这里需要注意的是,unloged操作类似Oracle中的nologging操作。根据我们过去的经验,nologging操作通常只在数仓或者一些测试环境中操作;主要是用于大数据量加载的速度提升。 由于只记录少量的日志,因此如果要进行数据恢复,可能就没戏了。
WITH语句兼容更多场景保持不物化
WITH语句也是Common table expressions (CTEs),可以把大的复杂查询分解为简小的片段,从而更易阅读和理解,同时使用WITH语句可以“物化”缓存多次重复的计算,降低冗余子查询及函数的副作用。
在PostgreSQL 12之前WITH语句默认是保持物化的行为,但物化行为也可能会引起执行变慢。PostgreSQL 12对WITH语句提供了MATERIALIZED/NOT MATERIALIZED的选项,同时默认行为改变为保持不物化。
MogDB 5.0版本保持兼容了这一行为,并对一些复杂场景,例如子查询内部被引用时,仍可保持不物化行为,使其可以被提升到上层查询,生成更优查询计划,以提升执行性能。
兼容PostgreSQL upsert语法
upsert相当于insert + update的组合,当数据行insert操作发生主键或唯一约束重复时,可触发update操作或者忽略不报错。
MogDB5.0新增兼容性里面除了支持兼容Oracle的语法之外,同时新增了兼容PostgreSQL的upsert语法能力:
--示例1
create table test_upsert (id int primary key,code varchar unique,info varchar);
insert into test_upsert (id,code,info)
values (1,'code1','info');
insert into test_upsert (id,code,info)
values (1,'code1','info extra1')
on conflict(id)
do update set info=excluded.info,id=excluded.id;
insert into test_upsert (id,code,info)
values (1,'code1','info extra2')
on conflict(id)
do update set info=excluded.info,code=excluded.code;
--示例2
create table test_upsert2 (
id int primary key,
code1 varchar not null,
code2 varchar not null,
info varchar,
unique(code1,code2)
);
insert into test_upsert2 (id,code1,code2,info) values (1,'openGauss','MogDB','info');
insert into test_upsert2 (id,code1,code2,info)
values (1,'openGauss','MogDB','db extra1')
on conflict(code1,code2)
do update set info=excluded.info,
id=excluded.id,
code1=excluded.code1;
test_upsert2表里使用了多字段唯一索引,下面upsert语句可以指定冲突的条件是unique(code1,code2),
而非主键id,同时在update子句也可对主键id或组合唯一索引的部分字段code1进行操作。
实际上除了这些小的点,还有很多;当然我个人也没有去完整里的梳理过,后续MogDB 5.2版本发布之后,我们会有更加完整的兼容性梳理(For Oracle、For MySQL以及For PostgreSQL)。
这里我给大家分享一个我们今年做的一个PostgreSQL到MogDB 5.0的改造case。 该用户源端数据库是PostgreSQL 12.4版本。
大家可以看到,实际上这个系统数据量还是很大的,表也比较多,接近4000个表,虽然存储过程这些几乎没有,但并不代表这个系统不复杂,不重要;相反这个系统是核心系统之一。
如果要说使用PG非常重要的系统,那么无疑就是鼎捷了,鼎捷ERP目前其中一个关键产品线使用的是MogDB,目前已经上线了很多客户了。
本文由 mdnice 多平台发布