因某项目测了PPAS和PostgreSQL的分区表在where条件里按分区键、函数、子查询等11中不同情况时的性能体现,两者基本一致,只有在in关键字和to_number函数的情况下不同,in关键字在PPAS中只扫描对应的子表,Postgres里做全表扫描;to_number函数在PostgreSQL中是没有的,因此报错,因为PPAS有兼容oracle引擎,所以没问题,走相应子表扫描。
相同的情况有:
按分区列值查询,只查询对应分区表
按分区列值做范围查询,只查询对应分区表
按分区列值和其它列查询,只查询对应分区表
按分区列值查询,值有显式类型转换,只查询对应分区表
按分区列值查询,值和列类型不同,值有隐式类型转换,只查询对应分区表
按分区列值查询,列要做隐式类型转换,走全表扫描
按分区列值查询,值使用了函数,走分区表索引扫描
按分区列值查询,值使用了子查询,用等号走全表扫描
按分区列值 更新,走分区表索引扫描
按分区列值 删除,走分区表索引扫描
具体情况见下面:
下面是pg中的过程
1 创建分区表
1.1 主表/子表继承
create table test (id integer primary key, name varchar(32));
CREATE TABLE t1_1000(LIKE test INCLUDING all) INHERITS(test);
CREATE TABLE t1001_2000(LIKE test INCLUDING all) INHERITS(test);
CREATE TABLE t2001_3000(LIKE test INCLUDING all) INHERITS(test);
CREATE TABLE t_other(LIKE test INCLUDING all) INHERITS(test);
ALTER TABLE t1_1000 ADD CONSTRAINT t1_1000_check CHECK (id >= 1 and id <1001);
ALTER TABLE t1001_2000 ADD CONSTRAINT t1_1000_check CHECK (id >= 1001 and id <2001);
ALTER TABLE t2001_3000 ADD CONSTRAINT t1_1000_check CHECK (id >= 2001 and id <3001);
ALTER TABLE t_other ADD CONSTRAINT t_other CHECK (id <= 0 or id >=3001);
1.2 定义触发器函数
CREATE OR REPLACE FUNCTION test_insert_trigger()
RETURNS TRIGGER AS $$
BEGIN
IF ( NEW.id >= 1 and NEW.id<1001) THEN
INSERT INTO t1_1000 VALUES (NEW.*);
ELSeIF ( NEW.id >= 1001 and NEW.id<2001) THEN
INSERT INTO t1001_2000 VALUES (NEW.*);
ELSeIF ( NEW.id >= 2001 and NEW.id<3001) THEN
INSERT INTO t2001_3000 VALUES (NEW.*);
ELSE
INSERT INTO t_other VALUES (NEW.*);
END IF;
RETURN NULL;
END;
$$ LANGUAGE plpgsql;
CREATE OR REPLACE FUNCTION test_delete_trigger()
RETURNS TRIGGER AS $$
BEGIN
IF ( old.id >= 1 and old.id<1001 ) THEN
DELETE FROM t1_1000 WHERE id=old.id;
ELSIF ( old.id >= 1001 and old.id<2001) THEN
DELETE FROM t1001_2000 WHERE id=old.id;
ELSIF ( old.id >= 2001 and old.id<3001 ) THEN
DELETE FROM t2001_3000 WHERE id=old.id;
ELSE
DELETE FROM t_other WHERE id=old.id;
END IF;
RETURN NULL;
END;
$$ LANGUAGE plpgsql;
1.3 加触发器
CREATE TRIGGER insert_test_trigger
BEFORE INSERT ON test
FOR EACH ROW EXECUTE PROCEDURE test_insert_trigger();
CREATE TRIGGER delete_test_trigger
BEFORE DELETE ON test
FOR EACH ROW EXECUTE PROCEDURE test_delete_trigger();
2
给表中插入值时自动根据ID值插入到分区表中
beigang=# INSERT INTO test(id, name)VALUES (6, 'ertr');
INSERT 0 0
beigang=#
beigang=# select * from test;
id | name
----+------
6 | ertr
(1 row)
beigang=#
beigang=# select count(*) from only test;
count
-------
0
(1 row)
beigang=# select count(*) from only t1_1000;
count
-------
1
(1 row)
^
beigang=#
beigang=# select count(*) from only t1001_2000;
count
-------
0
(1 row)
beigang=#
3
从父表中删除该值
beigang=# delete from test where id=6;
DELETE 1
beigang=#
beigang=# select count(*) from only t1_1000;
count
-------
0
(1 row)
4
批量插入值
beigang=# insert into test select generate_series(1,2600),'abc';
INSERT 0 0
beigang=#
beigang=# select count(*) from test;
count
-------
2600
(1 row)
beigang=# select count(*) from only test;
count
-------
0
(1 row)
beigang=# select count(*) from only t2001_3000;
count
-------
600
(1 row)
5
查询
5.1
按分区列值查询,只查询对应分区表
beigang=# explain select * from test where id=200;
QUERY PLAN
---------------------------------------------------------------------------------------------
Result (cost=0.00..8.27 rows=2 width=47)
-> Append (cost=0.00..8.27 rows=2 width=47)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: (id = 200)
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = 200)
(6 rows)
5.2
按分区列值做范围查询,只查询对应分区表
beigang=# explain select * from test where id<200 and id>100;
QUERY PLAN
------------------------------------------------------------------------------------------------
Result (cost=0.00..10.25 rows=101 width=9)
-> Append (cost=0.00..10.25 rows=101 width=9)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: ((id < 200) AND (id > 100))
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..10.25 rows=100 width=8)
Index Cond: ((id < 200) AND (id > 100))
(6 rows)
beigang=# explain select * from test where id<700 and id>100;
QUERY PLAN
---------------------------------------------------------------------------
Result (cost=0.00..20.00 rows=601 width=8)
-> Append (cost=0.00..20.00 rows=601 width=8)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: ((id < 700) AND (id > 100))
-> Seq Scan on t1_1000 test (cost=0.00..20.00 rows=600 width=8)
Filter: ((id < 700) AND (id > 100))
(6 rows)
beigang=#
beigang=# explain select * from test where id<1100 and id>900;
QUERY PLAN
------------------------------------------------------------------------------------------------------
Result (cost=0.00..20.50 rows=201 width=8)
-> Append (cost=0.00..20.50 rows=201 width=8)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: ((id < 1100) AND (id > 900))
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..10.25 rows=100 width=8)
Index Cond: ((id < 1100) AND (id > 900))
-> Index Scan using t1001_2000_pkey on t1001_2000 test (cost=0.00..10.25 rows=100 width=8)
Index Cond: ((id < 1100) AND (id > 900))
(8 rows)
5.3
按分区列值和其它列查询,只查询对应分区表
beigang=# explain select * from test where id=300 and name='ccc';
QUERY PLAN
---------------------------------------------------------------------------------------------
Result (cost=0.00..8.27 rows=2 width=47)
-> Append (cost=0.00..8.27 rows=2 width=47)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: ((id = 300) AND ((name)::text = 'ccc'::text))
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = 300)
Filter: ((name)::text = 'ccc'::text)
(7 rows)
5.4
按分区列值查询,值有显式类型转换,只查询对应分区表
beigang=# explain select * from test where id='5'::int;
QUERY PLAN
-------------------------------------------------------------------------------------------------------
Result (cost=0.00..5.27 rows=2 width=47)
-> Append (cost=0.00..5.27 rows=2 width=47)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: (id = 5)
-> Index Scan using test_t1_1000_pkey on test_t1_1000 test (cost=0.00..5.27 rows=1 width=8)
Index Cond: (id = 5)
(6 rows)
5.5
按分区列值查询,值和列类型不同,值有隐式类型转换,只查询对应分区表
beigang=# explain select * from test where id='5';
QUERY PLAN
-------------------------------------------------------------------------------------------------------
Result (cost=0.00..5.27 rows=2 width=47)
-> Append (cost=0.00..5.27 rows=2 width=47)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: (id = 5)
-> Index Scan using test_t1_1000_pkey on test_t1_1000 test (cost=0.00..5.27 rows=1 width=8)
Index Cond: (id = 5)
(6 rows)
5.6
按分区列值查询,列要做隐式类型转换,走全表扫描
beigang=# explain select * from test where id || name ='5abc';
QUERY PLAN
----------------------------------------------------------------------------
Result (cost=0.00..89.00 rows=18 width=30)
-> Append (cost=0.00..89.00 rows=18 width=30)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: (((id)::text || (name)::text) = '5abc'::text)
-> Seq Scan on t1_1000 test (cost=0.00..25.00 rows=5 width=8)
Filter: (((id)::text || (name)::text) = '5abc'::text)
-> Seq Scan on t1001_2000 test (cost=0.00..25.00 rows=5 width=8)
Filter: (((id)::text || (name)::text) = '5abc'::text)
-> Seq Scan on t2001_3000 test (cost=0.00..15.00 rows=3 width=8)
Filter: (((id)::text || (name)::text) = '5abc'::text)
-> Seq Scan on t_other test (cost=0.00..24.00 rows=4 width=86)
Filter: (((id)::text || (name)::text) = '5abc'::text)
(12 rows)
5.7
按分区列值查询,值使用了函数,pg没有to_number函数,报错
beigang=# explain select * from test where id=to_number('1');
ERROR: function to_number(unknown) does not exist
LINE 1: explain select * from test where id=to_number('1');
^
HINT: No function matches the given name and argument types. You might need to add explicit type casts.
5.8
按分区列值查询,值使用了函数,走分区表索引扫描
beigang=# explain select * from test where id=cast('1' as int);
QUERY PLAN
-------------------------------------------------------------------------------------------------------
Result (cost=0.00..5.27 rows=2 width=47)
-> Append (cost=0.00..5.27 rows=2 width=47)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: (id = 1)
-> Index Scan using test_t1_1000_pkey on test_t1_1000 test (cost=0.00..5.27 rows=1 width=8)
Index Cond: (id = 1)
(6 rows)
beigang=#
5.9
按分区列值查询,值使用了子查询,用等号走全表扫描,用in走分区表索引扫描
beigang=# explain select * from test where id in(select 1 );
QUERY PLAN
---------------------------------------------------------------------------------------------------
Nested Loop (cost=0.02..41.43 rows=1650 width=25)
Join Filter: (public.test.id = (1))
-> HashAggregate (cost=0.02..0.03 rows=1 width=4)
-> Result (cost=0.00..0.01 rows=1 width=0)
-> Append (cost=0.00..41.34 rows=5 width=39)
-> Index Scan using test_pkey on test (cost=0.00..8.27 rows=1 width=86)
Index Cond: (id = (1))
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = (1))
-> Index Scan using t1001_2000_pkey on t1001_2000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = (1))
-> Index Scan using t2001_3000_pkey on t2001_3000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = (1))
-> Index Scan using t_other_pkey on t_other test (cost=0.00..8.27 rows=1 width=86)
Index Cond: (id = (1))
(15 rows)
beigang=# explain select * from test where id =(select 1 );
QUERY PLAN
---------------------------------------------------------------------------------------------------
Result (cost=0.01..33.08 rows=5 width=39)
InitPlan 1 (returns $0)
-> Result (cost=0.00..0.01 rows=1 width=0)
-> Append (cost=0.00..33.07 rows=5 width=39)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=86)
Filter: (id = $0)
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = $0)
-> Index Scan using t1001_2000_pkey on t1001_2000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = $0)
-> Index Scan using t2001_3000_pkey on t2001_3000 test (cost=0.00..8.27 rows=1 width=8)
Index Cond: (id = $0)
-> Index Scan using t_other_pkey on t_other test (cost=0.00..8.27 rows=1 width=86)
Index Cond: (id = $0)
(14 rows)
5.10
按分区列值 更新,走分区表索引扫描
beigang=# explain update test set name = 'bbb' where id=99;
QUERY PLAN
----------------------------------------------------------------------------------------
Update on test (cost=0.00..8.27 rows=2 width=10)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=10)
Filter: (id = 99)
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..8.27 rows=1 width=10)
Index Cond: (id = 99)
(5 rows)
5.11
按分区列值 删除,走分区表索引扫描
beigang=# explain delete from test where id=99;
QUERY PLAN
---------------------------------------------------------------------------------------
Delete on test (cost=0.00..8.27 rows=2 width=6)
-> Seq Scan on test (cost=0.00..0.00 rows=1 width=6)
Filter: (id = 99)
-> Index Scan using t1_1000_pkey on t1_1000 test (cost=0.00..8.27 rows=1 width=6)
Index Cond: (id = 99)
(5 rows)
-----------------
转载请著明出处:
blog.csdn.net/beiigang
beigang.iteye.com
相关推荐
项目中有需求要垂直分表,即按照时间区间将数据拆分到n个表中,PostgreSQL提供了分区表的功能。分区表实际上是把逻辑上的一个大表分割成物理上的几小块,提供了很多好处,比如: 1、查询性能大幅提升 2、删除历史...
PostgreSQL表分区和子表及删除所有的数据库表 最近需求要求统计DNS近7天每天的解析情况。数据量相对大,所以我这边对表进行分区。 对每天的数据进行分区存储。主表只存储近7天的数据,7天之前的数据删掉。所以我...
总之,PostgreSQL分区表是一种有效的技术手段,能够解决大型表在数据管理和查询性能上所面临的挑战。它不仅提高了数据库的性能和存储效率,而且通过分而治之的策略,降低了数据维护的复杂性。数据库管理员应该根据...
在数据库管理中,分区表是一种优化查询性能的技术,它将一个大表分成多个较小、更易管理的部分,每个部分称为一个分区。PostgreSQL作为一个强大的开源关系型数据库管理系统,支持多种分区策略,如范围、列表、哈希等...
PostgreSQL 作为一款功能强大的开源关系型数据库系统,支持多种类型的表分区机制。本文将详细介绍 PostgreSQL 中的表分区技术,包括其工作原理、实现方法以及示例演示。 #### 二、表分区原理与实现 ##### 2.1 表...
许中清在2014年PostgreSQL中国大会上分享了关于PostgreSQL的原生表分区方案,这是数据库管理领域中一个非常重要的知识点,尤其适用于大型数据库系统的维护和优化。表分区是一种数据库架构优化技术,它允许将一个大表...
在PostgreSQL中,表分区是一种优化数据库性能的技术,它允许将大表的数据分割成更小、更易管理的部分,每个部分称为一个分区。这有助于提高查询速度,减少维护成本,并优化存储空间。以下是对创建表分区的详细说明:...
从这里可以看出PostgreSQL表...通过作用于主表的触发器,把主表的修改重定向到适当的分区表等工作,分区的创建和管理都需要我们用语言来控制,增加了开发人员的工作量,PostgreSQL表分区的所有表结构和表分区及触发器
1. 分区表的场景与意义:分区表在数据库管理中是一个重要的技术,它的存在可以帮助提升大型数据库的性能,并简化数据的维护和存储。分区表特别适用于数据量庞大的业务场景,比如配置表、状态表、流水表和统计表。...
表分区(Table Partitioning)是指在特定场景下,把逻辑上的一个大表分裂成多个更小的物理分片,以获得性能的提升。通过分区,可以减少查询的数据量,提高查询速度,减少索引的大小和维护成本。 什么是分区表? ...
PostgreSql数据库分区表.html
在postgresql10之后,引入了内置分区表,用户不需要先在父表上定义insert,update,delete触发器,对父表的DML操作会自动路由到相应分区,相比传统分区表大幅度降低了维护成本,目前内置分区表仅支持范围分区和列表...
在PostgreSQL中,表的继承是一个非常有用且强大的特性,它可以使得一个表(子表)继承另一个表(父表)的所有列和约束。这为数据库设计提供了一种灵活的方式来组织相似类型的数据,特别是当需要对一组共享相同属性的...
**Python-一个支持PostgreSQL11原生表分区的Django扩展** 在现代数据库系统中,数据量的增长是常态,为了提高查询效率和管理大量数据,表分区是一种常见的优化策略。PostgreSQL 11 引入了原生的表分区功能,允许...
PostgreSQL则更为灵活,支持B-树、哈希、R-树和Gist等多种索引类型,以及临时表、常规表和复杂分区表。 #### 十、约束与扩展功能 MySQL支持主键、外键、唯一和非空约束,对检查约束仅做解析但不强制执行。...
**cpp-pgpathman:PostgreSQL的高性能表分区插件** `cpp-pgpathman` 是针对 PostgreSQL 数据库系统设计的一个高效表分区插件。它提供了对数据表进行分区的能力,以优化大型数据库的性能,尤其适用于处理大量数据的...
PostgreSQL学习手册(表的继承和分区) PostgreSQL学习手册(常用数据类型) PostgreSQL学习手册(函数和操作符<一>) PostgreSQL学习手册(函数和操作符<二>) PostgreSQL学习手册(函数和操作符<三>) PostgreSQL学习手册...
优化SQL语句是提升数据库性能的直接方式,例如通过减少不必要的数据表连接、合理使用索引、优化查询条件等方式来提高查询效率。 文档还提到了如何让数据库输出好的执行计划。这需要通过执行计划分析工具,比如...