`

PostgreSQL启动过程中的那些事十八:bgwriter进程一

阅读更多

       话说 main()->PostmasterMain()->StartupDataBase() fork 了启动进程调用,调用 StartupXLOG 方法,启动 XLOG 、验证数据库一致性、根据情况做数据库恢复和创建检查点,然后启动进程退出。 Postmaster 进程响应启动进程退出信号,启动了后台写进程、 WAL 日志写进程、 AUTOVACUUM 进程、归档进程、统计进程这些辅助进程。

 

1

 

 

StartupDataBase 调用流程略图

 

这几个进程都调用自己相应的函数,组织不同入参,然后调用 postmaster_forkexec 函数,创建一个进程,根据不同的入参在 SubPostmasterMain 函数里走了不同的分支。

       这一节讨论后台写进程 bgwriter 的启动过程,其 是在 Postgres8.0 里新加的。

需要释放共享缓存以读入其他页面时,后台写进程( bgwriter )写出脏共享缓存数据 shared buffer )。在最好情况下所有从共享缓存里往外写将由后台写进程( bgwriter )发起。但是,如果后台写进程( bgwriter )没能维护足够多的干净共享缓存,其它后台进程仍然有权发起写脏共享缓存数据。

    后台写进程( bgwriter )还负责处理所有检查点( checkpoint )。在从上次以来定量时间之后他将自动分派检查点,且后台写进程( bgwriter )也能够被发信号执行被请求的检查点 。(每当很多 WAL 段被使用,后台进程填满 WAL 段时,通过后台进程信号通知后台写进程 bgwriter , GUC 参数安排 / 委任一个检查点;后台写进程( bgwriter )自己不查看条件。)

    后台写进程( bgwriter )由 postmaster 进程在启动子进程( startup process )一结束就启动,或者如果我们正在做归档回复,恢复进程一开始就启动。他一起存活到 postmaster 命令他结束。通常结束后台写进程( bgwriter )是通过 SIGUSR2 信号,且指示后台写进程( bgwriter )执行一个关闭检查点( shutdown checkpoint )并退出( exit(0) )。(在 SIGUSR2 信号发起之前所有 backend 进程必须被停止!)紧急结束通过信号 SIGQUIT ;和任何后台进程( backend )一样,后台写进程( bgwriter )将简单退出且在 SIGQUIT 信号上退出。

    如果后台写进程( bgwriter )非预期退出, postmaster 进程象处理 backend 进程崩溃一样处理:共享内存可能被破坏,因此现有的 backend 进程应该通过 SIGQUIT 信号被杀掉而且后面启动一个恢复周期。(甚至如果共享内存没有被破坏, pg 丢失了下一个检查点哪些文件需要同步的信息,因此需要强制做一个系统重启。)

 

pg 有三个 GUC 参数: bgwriter_delay (默认 200 毫秒)、 bgwriter_lru_maxpages (默认 100 )、 bgwriter_lru_multiplier (默认 2.0 )。系统每个 bgwriter_delay 时间唤醒 bgwriter ,扫描 LRU 链表,最多写出 N × bgwriter_lru_multiplier 且不超过 bgwriter_lru_maxpages 个脏缓冲页, N 是最近两次运行 bgwriter 期间系统申请的缓冲页数。如果 Bgwriter 频繁写经常更新的页会增加 I/O 次数而性能下降,但如果 bgwriter 间隔很长时间才写,又不能优化 I/O ,这个需要根据实际情况权衡。

 

2

       Bgwriter 进程启动后的调用流程图如下:

 

 

 

bgwriter 进程的调用流程略图

 

在启动进程里 Main()->SubPostmasterMain() ,调用了如下方法,启动 XLOG 后就结束了生命。

1 MemoryContextInt 方法,参见《 PostgresQL 启动过程中的那些事一》;

2 InitializeGUCOptions 方法,参见《 PostgresQL 启动过程中的那些事三》;

3 Read_backend_variablases 方法,为重组 BackendParameters 结构读取前面存储的文件 pgsql_tmp/pgsql_tmp.backend_var.[pid].[tmpFileNum]

4 PGSharedMemoryReAttach 方法, attach 进程 postmaster 里的共享内存;

5 read_nondefault_variables 方法,读非默认 GUC 参数,参见《 PostgresQL 中的那些事 十一:保存非默认 GUC 参数到文件 》;

6 ClosePostmasterPorts 方法,关闭“启动进程”不用的文件句柄,当然,在 postmaster 进程里这些文件还是打开的;

7 InitShmemAccess 方法,在初始化本进程共享内存全局变量:这些 shmem 头的 ShmemSegHdr shmem 起始地址 ShmemBase shmem 结束地址 +1 ShmemBase 。定义见下面。

static PGShmemHeader *ShmemSegHdr ;           /* shared mem segment header */

static void *ShmemBase;                      /* start address of shared memory */

static void *ShmemEnd;                       /* end+1 address of shared memory */

8 InitAuxiliaryProcess 方法,初始化一个 PGPROC 结构;

9 CreateSharedMemoryAndSemaphores 方法,参见《 PostgresQL 中的那些事七》;

10 BackgroundWriterMain 方法是辅助进程 bgWriter 进程的入口函数,其主要工作都在这个方法里。

 

SubPostmasterMain 的流程图见下面。根据启动进程的传入参数“ postgres –forkboot NULL [v_AuxProcType] ”走了 "--forkboot" 这个分支。还有 bgwriter 进程、 WalWriter 进程、 WalReciver 进程都走了这个分支,以后要讨论到相关进程,就直接从这个分支里开始了。还有 AutoVacuumLauncher 进程、 AutoVacuumWorker 进程、归档进程、统计进程以及为前端提供服务的 postgres 进程等在进程初始阶段,几乎没有区别的都走了 1-6 步,然后根据不同入参走了不同的分支,因此以后要讨论到这些进程,就直接从这些分支开始。

 

 



 

SubPostmasterMain 的流程图

 

8 InitAuxiliaryProcess 初始化了一个每个辅助进程都有一个的 PGPROC 结构。每一个后台进程都在共享内存里有一个 PGPROC 结构,共享内存里有一个未使用的 PGPROC 结构链表,从其中给新的后台进程分配。参见《 PostgresQL 启动过程中的那些事七初始化 ProcGlobal 》。

当等待锁时,这个 PGPROC 结构被链入锁的等待进程队列。回收后的 PGPROC 链入 ProcGlobal 的空闲进程列表。

注意,两阶段提交会为每一个当前已准备事务设置一个假的 PGPROC 。这些 PGPROC 出现在 ProcArray 数据结构里以使已准备事务显示其还在运行并且能正确显示其持有锁。已准备事务的 PGPROC 和真实进程的 PGPROC 的区别是已准备事务的 PGPROC pid 等于 0 。在已准备事务的 PGPROC 里不使用信号和锁行为,但是它的 myProcLocks[] 列表是有效的。

struct PGPROC

{

    /* proc ->links 必须是结构的第一个成员 */

    SHM_QUEUE   links ;        /* list link if process is in a list */

 

    PGSemaphoreData sem ;     /* ONE semaphore to sleep on */

    int         waitStatus ;       /* STATUS_WAITING, STATUS_OK or STATUS_ERROR */

 

    LocalTransactionId lxid ; /* local id of top-level transaction currently

                              * being executed by this proc , if running;

                              * else InvalidLocalTransactionId */

 

    TransactionId xid ;          /* id of top-level transaction currently being

                              * executed by this proc , if running and XID

                              * is assigned; else InvalidTransactionId */

 

    TransactionId xmin ;         /* minimal running XID as it was when we were

                              * starting our xact , excluding LAZY VACUUM:

                              * vacuum must not remove tuples deleted by

                              * xid >= xmin ! */

 

    int         pid ;          /* Backend's process ID; 0 if prepared xact */

 

    /* 当后台进程仍在启动时这些字段是 0: */

    BackendId   backendId ;    /* This backend's backend ID (if assigned) */

    Oid         databaseId ;       /* OID of database this backend is using */

    Oid         roleId ;           /* OID of role using this backend */

 

    bool        inCommit ;     /* true if within commit critical section */

 

    uint8       vacuumFlags ;  /* vacuum-related flags, see above */

 

    /* 当是热备模式时,显示已为当前事务发出冲突信号。尽管没有要求,当持有 ProcArrayLock 锁事设置 / 消除。如果需要,没有锁可以访问。

    bool        recoveryConflictPending ;

 

    /* 如果有,是进程当前正在等待的轻量锁的信息 */

    bool        lwWaiting ;    /* true if waiting for an LW lock */

    bool        lwExclusive ;  /* true if waiting for exclusive access */

    struct PGPROC * lwWaitLink ;  /* next waiter for same LW lock */

 

    /* 如果有,进程当前正在等待的锁的信息 */

    /* 如果当前没有等待的锁, waitLock waitProcLock NULL */

    LOCK       * waitLock ;     /* Lock object we're sleeping on ... */

    PROCLOCK    * waitProcLock ; /* Per-holder info for awaited lock */

    LOCKMODE    waitLockMode ; /* type of lock we're waiting for */

    LOCKMASK    heldLocks ;    /* bitmask for lock types already held on this

                              * lock object by this backend */

 

    Latch       procLatch ;    /* generic latch for process */

 

    /* 如果需要,是允许本进程等待同步复制的信息。如果没有等待的话 waitLSN 的值是 InvalidXLogRecPtr ;仅由用户后台进程设置。除非属主进程或 WALSender 进程可以 touch syncRepState 。仅当持有 SyncRepLock 锁时才可以用 syncRepLinks

      */

    XLogRecPtr waitLSN ;      /* waiting for this LSN or higher */

    int         syncRepState ; /* wait state for sync rep */

    SHM_QUEUE   syncRepLinks ; /* list link if process is in syncrep queue */

 

    /* 为锁持有的所有 PROCLOCK 对象或者由该后台进程等待的 PROCLOCK 被链入这些链表中的一个,根据他们锁的分区号。

    所有为持有锁或者有后台进程等待的 PROCLOCK 对象被链到这个列表,股他们锁的发布号。

      */

    SHM_QUEUE   myProcLocks [NUM_LOCK_PARTITIONS];

 

    struct XidCache subxids ; /* cache for subtransaction XIDs */

};

 

typedef struct SHM_QUEUE

{

    struct SHM_QUEUE * prev ;

    struct SHM_QUEUE * next ;

} SHM_QUEUE ;

 

10 步调用 BackgroundWriterMain 方法,做了 bgwriter 进程的主要工作。


AuxiliaryProcessMain 的流程图

AuxiliaryProcessMain 方法中,设置本进程运行模式为引导模式,调用 BaseInit 方法初始化了一个虚拟文件描述符结构 Vfd 的头指针 VfdCache 并注册了进程退出是清理临时文件的函数,接着初始化了存储管理器,这个另行讨论,最后初始化了本地记录每个缓存信息的数组 。然后根据情况 ProcSignalInit 为辅助进程分配 ProcSignalSlot ,调用 InitBufferPoolBackbend 方法,在其中调用 on_shmem_exit 注册共享内存退出清理缓存相关资源要调用的函数 AtProcExit_Buffers 。然后把进程设回通常模式。根据传入参数调用 BackgroundWriterMain ,做了 bgwriter 进程的主要主要工作。

先到这儿吧,下一篇接着讨论 BackgroundWriterMain 方法。

 


------------
转载请著明出处,来自博客:
blog.csdn.net/beiigang
beigang.iteye.com

 

  • 大小: 45.8 KB
  • 大小: 29.8 KB
  • 大小: 62 KB
  • 大小: 29.8 KB
  • 大小: 89.9 KB
0
7
分享到:
评论

相关推荐

    PostgreSQL中文手册9.2

    一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: . 50 PostgreSQL PostgreSQL...

    postgresql-42.3.1-API文档-中文版.zip

    赠送jar包:postgresql-42.3.1.jar; 赠送原API文档:postgresql-42.3.1-javadoc.jar; 赠送源代码:postgresql-42.3.1-sources.jar; 赠送Maven依赖信息文件:postgresql-42.3.1.pom; 包含翻译后的API文档:...

    关于PostGreSQL中的存储过程

    其中,存储过程是一个非常重要的概念,本文将对 PostgreSQL 中的存储过程进行详细的介绍和解释。 什么是存储过程 存储过程是一组为了完成特定任务而编写的 SQL 语句集合。它可以将复杂的操作封装起来,以便于重复...

    Postgresql存储过程

    Postgresql存储过程是指在Postgresql数据库中定义的一组SQL语句的集合,它可以完成复杂的操作,并且可以重复使用。Postgresql存储过程可以用来实现业务逻辑,减少数据库服务器的压力和网络传输的数据量。 一、存储...

    PostgreSQL 存储过程调试

    在IT行业中,数据库管理系统是核心组件之一,而PostgreSQL作为一款开源、强大的对象关系型数据库系统,被广泛应用于各种业务场景。本篇文章将深入探讨如何对PostgreSQL的存储过程进行调试,这对于优化数据库性能和...

    Go-PostgreSQLBGWorker用Go编写的PostgreSQL后台工作进程

    在PostgreSQL中,BGWorker是用户定义的后台进程,它们不是作为数据库服务器的一部分启动,而是由服务器启动并在需要时执行特定的任务。这种设计使得BGWorker能够执行长时间运行的操作,而不阻塞主线程或影响其他...

    一套C#与PostgreSQL数据库完美结合的实例

    本程序的重点是如何利用C#对PostgreSQL数据库进行操作,PDatabase.cs是一个完整的操作类,role是角色表的操作类,程序采用三层架构模型。 在对PostgreSQL数据库进行操作时,用到了如何调用存储过程来完成各项操作。...

    postgresql--内核分析--多进程结构

    - PostgreSQL采用了多进程模型,每个连接到数据库的客户端都会启动一个新的后端进程。 - 主要进程包括`postmaster`(负责监听客户端请求并启动其他进程)、`backend processes`(处理客户端查询)、`wal writer`...

    jeecgboot(postgreSQL).pdf

    在转换过程中,需要注意以下几点: * 将 MySQL 的 tinyint 类型转换为 PostgreSQL 的 int2 类型,这可能会导致实体属性类型不匹配的问题。 * 将 MySQL 的 hidden 类型转换为 PostgreSQL 的 int4 类型,这可能会导致...

    Linux下PostgreSQL安装与开机启动

    ### Linux下PostgreSQL安装与开机启动详解 #### 1. 添加用户及创建目录 为了确保PostgreSQL服务的安全性,我们通常会为它创建一个独立的系统用户。这一步骤包括了用户创建、密码设定以及相关目录的搭建。 ##### ...

    PostgreSQL修炼之道 从小工到专家.pptx

    PostgreSQL是一种功能强大且广泛应用的开源关系型数据库管理系统,本书《PostgreSQL修炼之道:从小工到专家》旨在帮助读者深入理解PostgreSQL的核心原理和最佳实践,从而提升数据库管理和开发的水平。 数据库基本...

    Postgresql存储过程.docx

    PostgreSQL 存储过程中的连接字符不是 `+`,而是使用 `||`。例如: ``` str := 'hello' || 'world'; ``` 四、控制结构 PostgreSQL 存储过程支持多种控制结构,包括条件语句、循环语句和跳转语句。 1. 条件语句 ...

    PostGreSQL安装部署系列:Centos 7.9 安装指定PostGreSQL-15版本数据库

    初始化数据库是PostgreSQL安装过程中必不可少的一步,可以通过执行以下命令完成: ```bash sudo /usr/pgsql-15/bin/postgresql-15-setup initdb ``` 初始化完成后,将会创建数据库目录并设置默认权限。 ##### 3.4...

    postgresql存储过程

    PostgreSQL存储过程是一种数据库编程的方法,它允许用户在数据库中定义和执行复杂的操作逻辑,而不仅仅是简单的查询。存储过程在数据库管理系统中起着至关重要的作用,它们可以提高性能,增加安全性,减少网络流量,...

    PostgreSQL 14.1 中文手册

    PostgreSQL 14.1 手册 PostgreSQL 全球开发组 翻译:彭煜玮1,PostgreSQL中文社区2文档翻译组

    postgresql-42.2.2-API文档-中文版.zip

    赠送jar包:postgresql-42.2.2.jar; 赠送原API文档:postgresql-42.2.2-javadoc.jar; 赠送源代码:postgresql-42.2.2-sources.jar; 赠送Maven依赖信息文件:postgresql-42.2.2.pom; 包含翻译后的API文档:...

    PostgreSQL(postgresql14-plperl-14.1-1PGDG.rhel7.x86_64.rpm)

    PostgreSQL(postgresql14-plperl-14.1-1PGDG.rhel7.x86_64.rpm)适用于RHEL/CentOS/Oracle Linux 7 - x86_64 PostgreSQL是一种特性非常齐全的自由软件的对象-关系型数据库管理系统(ORDBMS),是以加州大学计算机...

    postgresql-42.2.5-API文档-中英对照版.zip

    赠送jar包:postgresql-42.2.5.jar; 赠送原API文档:postgresql-42.2.5-javadoc.jar; 赠送源代码:postgresql-42.2.5-sources.jar; 赠送Maven依赖信息文件:postgresql-42.2.5.pom; 包含翻译后的API文档:...

    PostgreSQL博客1

    1. **postgres主进程**:这是启动数据库集群的父进程,负责管理其他子进程,如背景工作者和服务进程。 2. **后台工作者**:包括检查点进程、归档进程、统计收集器、Wal Writer等,它们执行各种后台任务,确保数据库...

    postgresql ubantu离线安装版

    PostgreSQL是一种开源的对象关系型数据库管理系统(ORDBMS),它在Ubuntu操作系统上广泛使用,尤其在需要稳定性和高性能的环境中。Ubuntu离线安装版的PostgreSQL适用于那些没有互联网连接或者网络带宽有限的环境,...

Global site tag (gtag.js) - Google Analytics