- 浏览: 232964 次
- 性别:
- 来自: 北京
文章分类
最新评论
-
chenxliang:
2016年10月26、27日,上海浦东,Postgres中国用 ...
PostgreSQL的用户、角色和权限管理 -
gejiod:
最近出了SQL:2011標準,希望樓主也更新下
SQL2008标准 -
lincon77:
太长了,又是E文,要是有些例子可能好理解些
SQL2003标准 -
少主丶无翼:
很谢,找了很久
SQL2003标准 -
zeeeitch:
...
PostgreSQL启动过程中的那些事七:初始化共享内存和信号二十:shmem中初始化堆同步扫描、pg子进程相关结构
话说 查询“ select cname, comp from test1, test2 where test1.id=test2.id; ” 发送到服务器端, 走查询分支 exec_simple_query ,先调用 start_xact_command 初始化了事务管理相关对象和资源,接着调用 pg_parse_query ,通过 Lex 和 Yacc 对传入 SQL 语句进行词法语法解析,生成解析树。下来调用 GetTransactionSnapshot 方法做内存快照,然后调用 pg_analyze_and_rewrite 方法,进行语义分析把 parsetree 转换成 querytree ,然后对该 querytree 进行重写。接着调用 pg_plan_queries 方法,根据 querytree 做查询 规划,生成查询计划树 plantree 。
1
下面是对 querytree 进行优化并生成 plantree 的调用序列图。
Postgres 服务进程简查之查询规划调用序列图
上图红色方框中显示了 pg_plan_queries 方法对 querytree 做查询 规划,生成查询计划树 plantree 的方法调用过程,大致上处理步骤是提升子连接和子查询、生成最优查询路径、生成执行计划。
在 subquery_planner 方法里都有方法 pull_up_sublinks 提升子连接,调用方法 pull_up_subqueries 提升子查询,目的是尽量合并父查询和子查询中的 WHERE 子句里的条件,尽量在做最耗费时间的表连接操作之前,先用约束条件把涉及到的元组数目缩到最小。接着处理表达式等,都是和前面同样的目的。
还有其中的方法 inline_set_returning_functions 内联返回函数、方法 preprocess_rowmarks 预处理行标记、方法 expand_inherited_tables 扩展集成表、方法 preprocess_expression 预处理表达式、方法 reduce_outer_joins 尽量减少外连接。
接着调用方法 grouping_planner 做规划处理,规划处理主要是生成路径,路径就是告诉执行器如何取到要操作的元组,这些元组可以来自一个表,也可以来自多个表,对于多个表,是按两两逐个连接完成,即 转化成多个两表连接查询 。举个例子,如一个查询涉及三个表 A 、 B 、 C 的连接,处理时可以先 A 、 B 连接生成结果 D ,再 D 、 C 连接得到目标结果集。这样连接的顺序就有多种,就产生了多个路径。方法 query_planner 生成了这些路径。然后评估代价,找出最优路径,把和最优路径对应的执行计划树 plantree 返回。 Pg 里面的代价估算采用基于成本的代价估算,本节后面会简单讨论一下这个估算方法。
这个过程涉及连接算法( Hash Join 、 Nested Loop 、 Merge Join )、扫描算法( Seq Scan 、 Index Scan 、 Bitmap Scan )、分组算法( HashAggregate 、 GroupAggregate )、排序算法等算法的选择。
这部分内容涉及到结构和处理及代码量比上节只多不少,在这就不列举了,有兴趣的根据方法调用流程图看源码吧,下面给出处理完的结果 plantree 结构图。
例子里查询语句对应的 plantree 结构图
把这个例子再重复一下:
create table test1 (ID numeric(10), cname varchar(30));
create table test2 (ID numeric(10), comp varchar(30));
select cname,comp from test1,test2 where test1.id=test2.id;
上面的图《例子里查询语句对应的 plantree 结构图》就是 SQL 语句“ select cname,comp from test1,test2 where test1.id=test2.id ”在 pg 里产生的 plantree 。
pg 输出的 querytree 如下:
2011-11-23 06:57:39 HKT LOG: plan:
2011-11-23 06:57:39 HKT DETAIL: {PLANNEDSTMT
:commandType 1
:hasReturning false
:hasModifyingCTE false
:canSetTag true
:transientPlan false
:planTree
{HASHJOIN
:startup_cost 24.63
:total_cost 116.69
:plan_rows 2113
:plan_width 156
:targetlist (
{TARGETENTRY
:expr
{VAR
:varno 65001
:varattno 2
:vartype 1043
:vartypmod 34
:varcollid 100
:varlevelsup 0
:varnoold 1
:varoattno 2
:location 7
}
:resno 1
:resname cname
:ressortgroupref 0
:resorigtbl 16394
:resorigcol 2
:resjunk false
}
{TARGETENTRY
:expr
{VAR
:varno 65000
:varattno 1
:vartype 1043
:vartypmod 34
:varcollid 100
:varlevelsup 0
:varnoold 2
:varoattno 2
:location 13
}
:resno 2
:resname comp
:ressortgroupref 0
:resorigtbl 16397
:resorigcol 2
:resjunk false
}
)
:qual <>
:lefttree
{SEQSCAN
:startup_cost 0.00
:total_cost 16.50
:plan_rows 650
:plan_width 94
:targetlist (
{TARGETENTRY
:expr
{VAR
:varno 1
:varattno 1
:vartype 1700
:vartypmod 655364
:varcollid 0
:varlevelsup 0
:varnoold 1
:varoattno 1
:location -1
}
:resno 1
:resname <>
:ressortgroupref 0
:resorigtbl 0
:resorigcol 0
:resjunk false
}
{TARGETENTRY
:expr
{VAR
:varno 1
:varattno 2
:vartype 1043
:vartypmod 34
:varcollid 100
:varlevelsup 0
:varnoold 1
:varoattno 2
:location -1
}
:resno 2
:resname <>
:ressortgroupref 0
:resorigtbl 0
:resorigcol 0
:resjunk false
}
)
:qual <>
:lefttree <>
:righttree <>
:initPlan <>
:extParam (b)
:allParam (b)
:scanrelid 1
}
:righttree
{HASH
:startup_cost 16.50
:total_cost 16.50
:plan_rows 650
:plan_width 94
:targetlist (
{TARGETENTRY
:expr
{VAR
:varno 65001
:varattno 1
:vartype 1043
:vartypmod 34
:varcollid 100
:varlevelsup 0
:varnoold 2
:varoattno 2
:location -1
}
:resno 1
:resname <>
:ressortgroupref 0
:resorigtbl 0
:resorigcol 0
:resjunk false
}
{TARGETENTRY
:expr
{VAR
:varno 65001
:varattno 2
:vartype 1700
:vartypmod 655364
:varcollid 0
:varlevelsup 0
:varnoold 2
:varoattno 1
:location -1
}
:resno 2
:resname <>
:ressortgroupref 0
:resorigtbl 0
:resorigcol 0
:resjunk false
}
)
:qual <>
:lefttree
{SEQSCAN
:startup_cost 0.00
:total_cost 16.50
:plan_rows 650
:plan_width 94
:targetlist (
{TARGETENTRY
:expr
{VAR
:varno 2
:varattno 2
:vartype 1043
:vartypmod 34
:varcollid 100
:varlevelsup 0
:varnoold 2
:varoattno 2
:location 13
}
:resno 1
:resname <>
:ressortgroupref 0
:resorigtbl 0
:resorigcol 0
:resjunk false
}
{TARGETENTRY
:expr
{VAR
:varno 2
:varattno 1
:vartype 1700
:vartypmod 655364
:varcollid 0
:varlevelsup 0
:varnoold 2
:varoattno 1
:location 50
}
:resno 2
:resname <>
:ressortgroupref 0
:resorigtbl 0
:resorigcol 0
:resjunk false
}
)
:qual <>
:lefttree <>
:righttree <>
:initPlan <>
:extParam (b)
:allParam (b)
:scanrelid 2
}
:righttree <>
:initPlan <>
:extParam (b)
:allParam (b)
:skewTable 16394
:skewColumn 1
:skewInherit false
:skewColType 1700
:skewColTypmod 655364
}
:initPlan <>
:extParam (b)
:allParam (b)
:jointype 0
:joinqual <>
:hashclauses (
{OPEXPR
:opno 1752
:opfuncid 1718
:opresulttype 16
:opretset false
:opcollid 0
:inputcollid 0
:args (
{VAR
:varno 65001
:varattno 1
:vartype 1700
:vartypmod 655364
:varcollid 0
:varlevelsup 0
:varnoold 1
:varoattno 1
:location 41
}
{VAR
:varno 65000
:varattno 2
:vartype 1700
:vartypmod 655364
:varcollid 0
:varlevelsup 0
:varnoold 2
:varoattno 1
:location 50
}
)
:location -1
}
)
}
:rtable (
{RTE
:alias <>
:eref
{ALIAS
:aliasname test1
:colnames ("id" "cname")
}
:rtekind 0
:relid 16394
:relkind r
:inh false
:inFromCl true
:requiredPerms 2
:checkAsUser 0
:selectedCols (b 9 10)
:modifiedCols (b)
}
{RTE
:alias <>
:eref
{ALIAS
:aliasname test2
:colnames ("id" "comp")
}
:rtekind 0
:relid 16397
:relkind r
:inh false
:inFromCl true
:requiredPerms 2
:checkAsUser 0
:selectedCols (b 9 10)
:modifiedCols (b)
}
)
:resultRelations <>
:utilityStmt <>
:intoClause <>
:subplans <>
:rewindPlanIDs (b)
:rowMarks <>
:relationOids (o 16394 16397)
:invalItems <>
:nParamExec 0
}
2
规划器为每个 SQL 的不同执行计划进行基于成本的代价估算, 查询的总代价包括读取数据的 IO 代价加上各种操作的代价之和, IO 代价包括顺序读取数据或索引页( seq_scan_cost )和随机读取数据页( random_scan_cost )的代价,操作代价包括处理表元组( cpu_tuple_cost )、处理比较操作( cpu_operator_cost )和处理索引元组( cpu_index_tuple_cost ),因此,如果在一个表上做全表顺序扫描并执行过滤,其代价是:
Cost = seq_scan_cost*relpages + cpu_tuple_cost*reltuples + cpu_operator_cost*reltuples
其中 relpages 、 reltuples 是系统表 pg_class 里的字段, seq_scan_cost 、 cpu_tuple_cost 、 cpu_operator_cost 是影响成本计算的参数,这些参数包括 cpu_index_tuple_cost (0.005) 、 cpu_operator_cost (0.0025) 、 cpu_tuple_cost (0.01) 、 random_page_cost (4.0) 、 seq_page_cost (1.0) , 参数后面括号里的是默认值,这些参数值可以根据情况改变。 传统上,它们以抓取顺序页的成本作为基准单位,也就是将 seq_page_cost 设为 1.0 ,同时其它参数是对照它来设置的。
就到这儿吧。
------------
转载请注明出处,来自博客:
blog.csdn.net/beiigang
beigang.iteye.com
发表评论
-
PostgreSQL服务过程中的那些事三:pg服务进程中的内存上下文
2012-12-31 15:07 2078题外话:年底了,就以这篇博文结束2012 ... -
PostgreSQL服务过程中的那些事二:Pg服务进程处理简单查询六:执行器执行
2012-11-07 20:13 1862话说 查询“ select c ... -
PostgreSQL服务过程中的那些事二:Pg服务进程处理简单查询四:分析重写成querytree
2012-10-24 19:27 1446话说 查询“ select cname, comp ... -
postgresql 小技巧
2012-10-16 19:36 1417Note : #PostgreSQL and ... -
PostgreSQL服务过程中的那些事二:Pg服务进程处理简单查询三:获取内存快照
2012-10-16 19:31 1788话说 查询“ select cname, comp ... -
PostgreSQL服务过程中的那些事二:Pg服务进程处理简单查询二:SQL解析为parsetree
2012-10-09 19:50 1567话说 查询“ select cname, comp fr ... -
PostgreSQL服务过程中的那些事二:Pg服务进程处理简单查询一:开启事务
2012-09-25 19:55 1911在《 PostgreSQL 服务过程中的那些事二: ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程一.八:加载DB基础设施,完成服务进程初始化
2012-09-18 21:02 1817话说调用 InitPostgres ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程一.七:初始化portal管理环境
2012-09-11 19:58 1666话说调用 In ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程一.六:初始化系统表缓存catcache
2012-09-04 20:51 1879话说调用 InitPostgres ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程一.五:初始化relcache管理环境
2012-08-28 20:47 1335话说调用 InitPostgres ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程三:初始化relcache管理环境
2012-08-28 20:46 0<!-- [if gte mso 9]><x ... -
PostgreSQL服务过程中的那些事二:Pg服务进程处理简单查询梗概
2012-08-21 21:04 1272话说客户端发起请求, pg 服务器为该请求启动一个 ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程二:建立连接完成
2012-08-13 18:50 15903 这节主要讨论 pg 服务进程 pos ... -
PostgreSQL服务过程中的那些事一:启动postgres服务进程一
2012-08-08 14:42 5727到pg 服务进程了,打算搞一个完整但简单的查询例子,从 ... -
PostgreSQL启动过程中的那些事十九:walwriter进程二
2012-08-03 16:53 13913 这节主要讨论 walwrit ... -
PostgreSQL启动过程中的那些事十九:walwriter进程一
2012-08-01 17:26 1634话说 main()->Po ... -
PostgreSQL启动过程中的那些事十八:bgwriter进程二
2012-07-27 07:25 14473 这节主要讨论 bgwr ... -
PostgreSQL启动过程中的那些事十八:bgwriter进程一
2012-07-23 20:18 1666话说 main()->Postm ... -
PostgreSQL启动过程中的那些事十六:启动进程三:CheckPointGuts刷出共享内存里所有数据
2012-07-12 16:24 1503话说启动进程调用 Startup ...
相关推荐
三、 pg_attrdef: pg_attrdef: pg_attrdef:pg_attrdef:pg_attrdef:pg_attrdef:pg_attrdef:pg_attrdef:pg_attrdef: . 63 四、 pg_authid: pg_authid: pg_authid: pg_authid:pg_authid: 64 五、 pg_auth_members: pg_...
pgAdmin是一款免费的开源软件,专为PostgreSQL设计,提供了直观的界面,使得数据库的管理、查询、备份以及监控等工作变得简单易行。 **1. pgAdmin简介** pgAdmin是PostgreSQL数据库管理员和开发者的理想选择,它...
总结来说,调试PostgreSQL存储过程涉及多个层面,从简单的日志记录到复杂的源码调试,都需要对PostgreSQL有深入的理解。熟练掌握这些技巧,将有助于提升数据库应用的稳定性和性能。通过不断实践和学习,你可以成为一...
Postgresql存储过程是指在Postgresql数据库中定义的一组SQL语句的集合,它可以完成复杂的操作,并且可以重复使用。Postgresql存储过程可以用来实现业务逻辑,减少数据库服务器的压力和网络传输的数据量。 一、存储...
DBD::Pg作为DBI的子模块,专为PostgreSQL提供服务。 **PostgreSQL与libpq** PostgreSQL,通常简称为Postgres,是一种开源的关系型数据库管理系统(RDBMS),以其高度的稳定性和强大的功能著称。libpq是PostgreSQL...
在本文中,我们将深入探讨 PostgreSQL 的事务处理机制,包括事务的基本概念、事务处理的原理、事务处理的优化方案等。 事务处理在数据库中的重要性 事务处理是数据库系统中非常重要的一个环节,它确保了数据的...
在Linux系统上搭建PostgreSQL、PostGIS和pg_pathman环境是一项关键的任务,这些组件共同构成了一个强大的地理空间数据库解决方案。PostgreSQL是一种开源的关系型数据库管理系统,具有高度的可扩展性和可靠性;...
查询sql的死锁进程,查找并杀死。解决生产数据库中卡死的现象。postgresql查询死锁以及杀死死锁进程sql
PostgreSQL是一种开源的对象关系型数据库管理系统(ORDBMS),它以其强大的功能、高度的稳定性以及对ACID(原子性、一致性、隔离性、持久性)事务的支持而受到广大开发者的欢迎。离线安装包通常是为了在没有网络连接...
【PostgreSQL教程(十一):服务器配置】 在PostgreSQL中,服务器配置是管理和优化数据库性能的关键环节。本教程主要涵盖服务器进程的启动和关闭以及配置参数的设置。 ### 一、服务器进程的启动和关闭 PostgreSQL...
在实际应用中,DBD::Pg允许开发者执行SQL查询、事务管理、游标操作、结果集处理等常见的数据库操作。使用DBI和DBD::Pg,开发者可以编写可移植的代码,只需更换数据库驱动,就可以轻松地将应用程序从一种数据库系统...
在本文中,我们将深入探讨pgAdmin3的功能、安装过程以及如何使用它来管理PostgreSQL数据库。 ### pgAdmin3 简介 pgAdmin3 是一个开源的、跨平台的应用程序,适用于Windows、Linux、Mac OS X等多种操作系统。作为...
PostgreSQL 存储过程详解 PostgreSQL 是一个开源的数据库管理系统,它提供了强大的数据存储和管理功能。...本文详细介绍了 PostgreSQL 中的存储过程,并提供了一个使用函数来查询数据的示例代码。
在PostgreSQL数据库系统中,后台工作进程(Background Worker)是一种扩展其功能的重要机制。这些进程独立于主要的数据库服务器进程运行,允许开发者实现自定义任务,如定期维护、监控或其他后台服务。Go语言以其...
综上所述,优化PostgreSQL中的LIKE模糊查询涉及多种策略,包括使用全文搜索、相似度查询、优化索引结构以及调整查询计划。针对具体的应用场景和数据特性,结合这些方法,可以显著提升查询效率,降低数据库的负载,...
【嵌入式PostgreSQL服务器】是一种特殊的数据库实现,它允许开发者将PostgreSQL数据库引擎直接集成到他们的应用程序中,而不是作为独立的服务运行。这样的设计对于那些需要在本地或内存中快速访问数据的应用,或者...
### PostgreSQL内核分析——多进程结构 #### 一、进程的理解与创建 进程是一个正在运行的程序实例,它具有动态的特性。对于程序员而言,所编写的代码在未经编译之前仅是静态的源代码。当这些代码经过编译、链接等...
1. **安装与配置**:pgAdmin3-1.8.4的安装过程相对简单,支持Windows、Linux和macOS等多个操作系统。安装完成后,用户需要配置连接参数,如主机名、端口号、数据库名、用户名和密码,以便连接到PostgreSQL服务器。 ...
在编译 PostgreSQL 的过程中,需要带上 --with-perl 选项,以便正确地安装 Pl/PerlU 语言组件。 五、安装依赖包 在主节点上,需要安装以下依赖包: * DBI 模块 * DBD::Pg 模块 * DBIx::Safe 模块 其中,DBI 模块...
对于那些需要处理大量数据或需要复杂查询的项目,PostgreSQL是一个理想的选择。 PgAdmin4是PostgreSQL的官方管理工具,它允许用户通过Web浏览器进行数据库管理。这个压缩包中的"edb_apachephp.exe"文件可能是用于...