`

PostgreSQL启动过程中的那些事七:初始化共享内存和信号三:shmem中初始化clog

阅读更多

       pg 初始化完 shmem ,给其加上索引 "ShmemIndex" 后,接着就在 shmem 里初始化 xlog 。然后依次初始化 clog subtrans twophase multixact 。安排按 clog subtrans multixact twophase 的顺序写,把 twophase 放到 multixact 之后是因为前面三个用了相同的算法和数据结构,连起来写可以加深印象和归类记忆,本来想把初始化 clog subtrans multixact 放到一篇文章里写,因为篇幅太长还是分开了,看的时候这几篇文章可以结合起来看。

pg 事务提交日志( CLOG )是相对于事务日志( XLOG )小的独立的内存段。

事务提交日志( CLOG )和事务日志( XLOG )是什么关系呢?无论什么时候,当一个新的事务提交日志( CLOG )页被初始化为 0 时,会产生一个事务日志( XLOG )记录。在事务中提交或退出事务时的写事务提交日志( CLOG ),为事务产生了自己的事务日志( XLOG )记录,且在 redo 日志上更新相关重放 / 重做动作;因此 pg 需要在事务提交日志( CLOG )里做一个没有任何额外附加的和事务日志( XLOG )里相关记录对应的记录。而且,在 pg 被要求记录提交事务日志( CLOG )前,事务日志( XLOG )保证通过对应的事务提交日志( CLOG )记录已经刷新,因此“在写数据前写事务日志 xlog ”的 WAL 原则对于提交已经满足,而且我们不用关心事务退出。所以 pg 不需要用 LSN 信息标记事务提交日志( CLOG )页面; pg 已经有了足够的同步。

pg 用简单 最近最少使用算法(SLRU )管理 clog subtrans multixact 页面缓冲池。

在一般情况下,我们希望写流量发生在最近使用的页面。读流量可能会有较大的页面跨度,但任何情况下相当少的页面数量已经足够了。因此, pg 仅使用纯线性查询搜索缓冲区,而没有必要使用哈希表或别的东西。除了永远不会交换出最近页面(因为我们知道最终它会再次命中)外管理算法是 LRU

pg 使用一个控制轻量锁( control LWLock )保护共享数据结构,再加上每缓冲页轻量锁( per-buffer LWLocks )为每个缓冲区 / 页同步 IO 。检查或修改任何共享状态必须持有控制锁。进程在读入或写出一个缓冲页时只需要持有工作在该该缓冲页上的每缓冲页锁就可以了 ,不需要持有控制锁。 (关于锁到并发控制时再讨论)

除了 SimpleLruReadPage_ReadOnly() 外“持有控制锁”在所有情况下指的是排他锁。

    当在一个缓冲页上初始化I/O 时,只要在释放控制锁之前获得 每缓冲页锁。在完成 I/O 后,释放每缓冲页锁,重新获得控制锁,且更新共享状态。(在这儿死锁是不可能的,因为其它进程在同一个缓冲页上做 I/O 的时候,从不尝试在该缓冲页启动 I/O 操作。)等待 I/O 完成,释放控制锁,在共享模式中获得每缓冲页锁,立即释放每缓冲页锁,重新获得控制锁,且再次检查状态(因为没有持有锁的时候可能会发生意外的事情)。

       使用 缓冲区管理器时,有可能发生其它进程写当前正在被写出的缓冲页。这个通过重置缓冲页的 page_dirty 标签来处理。

上面综合性讨论了事务提交日志、其和 XLOG 的关系、相关的缓冲及同步时用的锁等,下来我们看方法调用流程

 

1 先上个图,看一下函数调用过程梗概,中间略过部分细节


 

初始化 clog 方法调用流程图

 

2 初始化 xlog 相关结构

话说 main()->…->PostmasterMain()->…->reset_shared() -> CreateSharedMemoryAndSemaphores()->…-> CLOGShmemInit () ,初始化提交事务日志( CLOG )相关数据结构 ClogCtlData 等,用作内存里管理和缓存提交事务日志文件(存放在 "data/pg_clog" 文件夹里的文件)。

CLOGShmemInit () 函数里,首先在 shmem 的哈希表索引 "ShmemIndex" 上给事务提交日志( CLOG )增加一个 HashElement ShmemIndexEnt entry ), shmem 里根据 ClogCtlData 等相关结构      大小调用 ShmemAlloc() 分配内存空间,使 ShmemIndexEnt 的成员 location 指向该空间, size 成员记录该空间大小

CLOGShmemInit () 调用 ShmemInitStruct() 在其中 调用 hash_search() 在哈希表索引 "ShmemIndex" 中查找 "CLOG Ctl" ,如果没有,就在 shmemIndex 中给 "CLOG Ctl" 分一个 HashElement ShmemIndexEnt entry ,在其中的 Entry 中写上 "CLOG Ctl" 。返回 ShmemInitStruct() ,再调用 ShmemAlloc() 在共享内存上给 "CLOG Ctl" 相关结构(见下面“ XLog 相关结构图” )分配空间,设置 entry (在这儿及ShmemIndexEnt 类型变量)的成员 location 指向该空间, size 成员记录该空间大小 最后返回 CLOGShmemInit () ,让 SlruCtlData * 类型 全局变量 ClogCtl 指向 SlruCtlData * 类型静态 全局变量 ClogCtlData ClogCtlData 的起始地址就是在shmem 里给 "CLOG Ctl" 相关结构分配的内存起始地址,设置其中ClogCtlData 结构类型的成员值。 相关变量、结构定义和 初始化完成后数据结构图在下面。

 

#define ClogCtl (&ClogCtlData)

static SlruCtlData ClogCtlData;

 

typedef struct SlruCtlData

{

    SlruShared  shared;

 

    /*

      * This flag tells whether to fsync writes (true for pg_clog, false for

      * pg_subtrans).

      */

    bool         do_fsync;

 

    /*

      * Decide which of two page numbers is "older" for truncation purposes. We

      * need to use comparison of TransactionIds here in order to do the right

      * thing with wraparound XID arithmetic.

      */

    bool         (*PagePrecedes) (int , int );

 

    /*

      * Dir is set during SimpleLruInit and does not change thereafter. Since

      * it's always the same, it doesn't need to be in shared memory.

      */

    char         Dir[64];

} SlruCtlData;

 

typedef SlruCtlData *SlruCtl;

 

/*

  * Shared-memory state

  */

typedef struct SlruSharedData

{

    LWLockId    ControlLock;

 

    /* Number of buffers managed by this SLRU structure */

    int          num_slots;

 

    /*

      * Arrays holding info for each buffer slot.  Page number is undefined

      * when status is EMPTY, as is page_lru_count.

      */

    char       **page_buffer;

    SlruPageStatus *page_status;

    bool        *page_dirty;

    int         *page_number;

    int         *page_lru_count;

    LWLockId   *buffer_locks;

 

    /*----------

      * We mark a page "most recently used" by setting

      *      page_lru_count[slotno] = ++cur_lru_count;

      * The oldest page is therefore the one with the highest value of

      *      cur_lru_count - page_lru_count[slotno]

      * The counts will eventually wrap around, but this calculation still

      * works as long as no page's age exceeds INT_MAX counts.

      *----------

      */

    int          cur_lru_count;

 

    /*

      * latest_page_number is the page number of the current end of the log;

      * this is not critical data, since we use it only to avoid swapping out

      * the latest page.

      */

    int          latest_page_number;

} SlruSharedData;

 

typedef SlruSharedData *SlruShared;

 

下面看看初始化完 "CLOG Ctl" 相关结构后在内存中的结构图


初始化完 clog 的内存结构图

 

       为了精简上图,把创建 shmem 的哈希表索引 "ShmemIndex" 时创建的 HCTL 结构删掉了,这个结构的作用是记录创建可扩展哈希表的相关信息。增加了左边灰色底的部分,描述 共享内存 /shmem 里各变量物理布局概览,由下往上,由低地址到高地址。其中的 "CLOG Ctl" clog 的相关结构图下面分别给出,要不上面的图太大太复杂了。

 

 

CLOG 相关结构图

 

  • 大小: 57.5 KB
  • 大小: 107.8 KB
  • 大小: 164 KB
0
1
分享到:
评论

相关推荐

    nacos-2.0.1 postgresql初始化脚本

    nacos-2.0.1 postgresql初始化脚本

    quartz-2.2.3版本的quartz初始化sql语句

    在Quartz 2.2.3版本中,初始化数据库是使用Quartz的关键步骤,因为Quartz依赖于一个持久化存储来保存作业和触发器的信息。这个过程通常涉及执行一系列SQL语句来创建必要的表结构。 Quartz的初始化SQL语句主要用于...

    PostgreSQL中文手册9.2

    一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: 一、服务器进程的启动和关闭: . 50 PostgreSQL PostgreSQL...

    在windows下手动初始化PostgreSQL数据库教程

    在初始化过程中,initdb会生成一系列的配置文件和数据库模板,并设置默认的最大连接数、共享缓冲区等参数。完成初始化之后,会得到一系列的成功消息,表明数据库系统已经准备就绪。 最后,使用pg_ctl工具来启动...

    quartz-job初始化数据表.zip

    Quartz 是一个开源的作业...总之,"quartz-job初始化数据表.zip" 文件是设置Quartz作业调度系统的关键步骤,它确保了数据库能正确地存储和管理所有的Job和Trigger信息,从而使得Quartz能够在适当的时间执行预定的任务。

    关于PostGreSQL中的存储过程

    其中,存储过程是一个非常重要的概念,本文将对 PostgreSQL 中的存储过程进行详细的介绍和解释。 什么是存储过程 存储过程是一组为了完成特定任务而编写的 SQL 语句集合。它可以将复杂的操作封装起来,以便于重复...

    8基础 5:初始化 MySQL 数据库并建立连接(3).md

    在本节内容中,我们将深入了解如何使用Go语言和GORM库初始化MySQL数据库,并建立与该数据库的连接。GORM是一个流行的Go语言ORM(对象关系映射)库,它允许开发者通过编程方式与数据库交互,而无需编写大量的SQL代码...

    Postgresql存储过程

    Postgresql存储过程详解 Postgresql存储过程是指在Postgresql数据库中定义的一组SQL语句的...Postgresql存储过程是Postgresql数据库中的一种强大工具,可以实现复杂的操作,提高数据库服务器的性能和应用程序的性能。

    linux配置postgresql

    在 Linux 系统中,可以通过以下命令启动 PostgreSQL: ``` # su – postgres pg$ /usr/local/pgsql/bin/postmaster ``` 这将启动 PostgreSQL 数据库服务器,并允许用户访问数据库。 配置 PostgreSQL 数据库需要多个...

    PostGreSQL安装部署系列:Centos 7.9 安装指定PostGreSQL-15版本数据库

    初始化数据库是PostgreSQL安装过程中必不可少的一步,可以通过执行以下命令完成: ```bash sudo /usr/pgsql-15/bin/postgresql-15-setup initdb ``` 初始化完成后,将会创建数据库目录并设置默认权限。 ##### 3.4...

    postgresql-42.3.1-API文档-中文版.zip

    赠送jar包:postgresql-42.3.1.jar; 赠送原API文档:postgresql-42.3.1-javadoc.jar; 赠送源代码:postgresql-42.3.1-sources.jar;...人性化翻译,文档中的代码和结构保持不变,注释和说明精准翻译,请放心使用。

    Linux下PostgreSQL安装与开机启动

    初始化数据库是设置PostgreSQL的重要步骤之一,它创建数据库集群。 ##### 操作命令: ```bash su postgres /usr/local/pgsql/bin/initdb -D /usr/local/pgsql/data ``` **解释:** - `su postgres`:切换到`...

    PostgreSQL修炼之道 从小工到专家.pptx

    * PostgreSQL配置:包括设置数据库参数、内存管理和日志记录等方面。 数据类型与表达式 * 数据类型:包括整数、字符串、日期时间、布尔值等基本数据类型。 * 表达式:包括算术运算符、比较运算符、逻辑运算符和...

    postgresql离线安装包及依赖库

    这些指南通常会解释如何解压安装包、配置环境变量、初始化数据库集群以及启动和停止服务。 4. 数据库管理工具:除了核心服务器之外,可能还包括了一些数据库管理工具,例如pgAdmin,它是一个图形化的管理工具,让...

    windows环境下新版12.2postgreSQL的安装+初始化配置+启动

    总之,安装和配置Windows上的PostgreSQL 12.2涉及到下载安装文件、初始化数据库、设置服务启动和配置连接参数等步骤。遵循这些步骤,你就可以顺利地在Windows环境中搭建起一个功能齐全的PostgreSQL数据库系统了。 ...

    postgresql8.2.3 中文文档

    1. **安装与配置**:这部分内容会指导用户如何在不同操作系统上安装 PostgreSQL,包括设置数据目录、初始化数据库集群、配置服务器参数以及启动和停止服务。 2. **SQL语言**:文档详细介绍了SQL的使用,包括数据...

    Ubuntu 下源码安装Postgresql

    七、初始化数据库目录 使用 initdb 命令初始化数据库目录: ./initdb -D PGDATA/postgres 八、启动数据库 使用以下命令启动数据库: ./postgres -D PGDATA/postgres 九、配置开机启动 为了使数据库在开机时...

    PostgreSQL 12.2 安装手册

    初始化数据库是为了使 PostgreSQL 数据库能够正常运行。包括设置数据库密码、创建数据库目录、初始化数据库结构等步骤。 登录数据库 登录数据库是为了对 PostgreSQL 数据库进行管理和维护。使用 psql 命令可以连接...

    Postgresql-10安装包

    10. **阅读官方文档**:PostgreSQL 提供详细的官方文档,包括安装、配置和使用指南,强烈建议在安装和使用过程中参考。 **四、安装脚本的使用** 如果你从博主那里获取了安装脚本,通常这是一个包含上述步骤的自动...

    postgresql-42.2.5-API文档-中英对照版.zip

    赠送jar包:postgresql-42.2.5.jar; 赠送原API文档:postgresql-42.2.5-javadoc.jar;...人性化翻译,文档中的代码和结构保持不变,注释和说明精准翻译,请放心使用。 双语对照,边学技术、边学英语。

Global site tag (gtag.js) - Google Analytics