Hugepages是从Linux kernal 2.6后被引入的,其目的是使用更大的memory page size以适应越来越大的系统内存。
在我上大学那会,买一条64M 133Mhz的内存(对,你没看错,64M)价格为500多人民币,而现在4G 1600Mhz的内存的价格也就500多。
计算机硬件的发展速度太快了,所以操作系统的一些配置也要相应的随之改变。
在Linux下,默认的page size大小为4k。显然对于现在的SGA比较大的数据库系统来说,4k的page size有点太小了。
我们来看看两者之间有什么区别
1. Page Table大小
Page Table是用来存放虚拟内存也和物理内存页对应关系的内存结构。因为page size较小,所以相应的改内存结构也会比较大。
而Hugepages的常见page size为2M,是4k size的500倍,所以可以大大减小page table的size。
我们来看两个例子:
这是一个没有配置Hugepage的系统,系统内存128G,pagetable大小大约为4G。
cat /proc/meminfo
MemTotal: 132086880 kB
PageTables: 4059612 kB
这是配置了Hugepage的系统,系统内存96G, PageTable大小仅为78M
MemTotal: 98999880 kB
PageTables: 79916 kB
2. 大大提高了CPU cache中存放的page table所覆盖的内存大小,从而提高了TLB命中率
进程的虚拟内存地址段先连接到page tables然后再连接到物理内存。所以在访问内存时需要先访问page tables得到虚拟内存和物理内存的映射关系,然后再访问物理内存。
CPU cache中有一部分TLB(Translation Lookaside Buffer)用来存放部分page table以提高这种装换的速度。因为page size变大了,所以同样大小的TLB,所覆盖的内存大小也变大了。提高了TBL命中率,也就是提高了地址转换的速度。
3. 使用Hugepages的内存页是不会被交换出去的,永远常驻在内存中,所以也减少了内存也替换的额外开销
下面再说说在数据库服务器上使用Hugepages要注意的几点
1. Hugepages是在分配后就会预留出来的,其大小一定要比服务器上所有实例的SGA总和要大,差一点都不行。
比如说Hugepages设置为90G,oracle SGA为91G,那么oracle在启动的时候就不会使用到这90G的Hugepages。这90G就浪费了。所以在设置Hugepages时要计算SGA的大小,后面会给出一个脚本来计算。
2. 其他进程无法使用Hugepages的内存,所以不要设置太大,稍稍比SGA大一点保证SGA可以使用到hugepages就好了。
3. PGA不会使用Hugepages的内存。所以11g的AMM (Automatic Memory Management,memory_target参数)是不被支持的。而ASMM(Automatic Shared Memory Management, SGA_target参数)是被支持的,这两个不要搞混淆了。
4. 在meminfo中和Hugepage相关的有四项(RHEL5)
HugePages_Total: 43000
HugePages_Free: 29493
HugePages_Rsvd: 23550
Hugepagesize: 2048 kB
HugePages_Total为所分配的页面数目,和Hugepagesize相乘后得到所分配的内存大小。43000*2/1024大约为84GB
HugePages_Free为从来没有被使用过的Hugepages数目。即使oracle sga已经分配了这部分内存,但是如果没有实际写入,那么看到的还是Free的。这是很容易误解的地方
HugePages_Rsvd为已经被分配预留但是还没有使用的page数目。在Oracle刚刚启动时,大部分内存应该都是Reserved并且Free的,随着oracle SGA的使用,Reserved和Free都会不断的降低
HugePages_Free – HugePages_Rsvd 这部分是没有被使用到的内存,如果没有其他的oracle instance,这部分内存也许永远都不会被使用到,也就是被浪费了。在该系统上有11.5GB的内存被浪费了。
Note: RHEL4上的meminfo有所区别,没有HugePages_Rsvd这一项,并且当oracle instance启动时,所分配的内存就从free list上被移除掉了。也就是启动后HugePages_Free就是没有被SGA用到被浪费的内存。
最后说说如何设置HugePages:
1. 首先计算SGA大小已决定你要使用多少HugePages内存页。
你可以手工计算,如果使用了ASMM可以用SGA_Target/Hugepagesize,否则可以将db_cache_size,large_pool_size, shared_pool_size,jave_pool_size, streams_pool_size五个部分加起来除以Hugepagesize。
或者可以先将oracle instance都起起来,然后ipcs -m查看共享内存段大小来计算。oracle在401749.1中也提供了一个脚本来帮助计算,脚本如下:
#!/bin/bash
#
# hugepages_settings.sh
#
# Linux bash script to compute values for the
# recommended HugePages/HugeTLB configuration
#
# Note: This script does calculation for all shared memory
# segments available when the script is run, no matter it
# is an Oracle RDBMS shared memory segment or not.
#
# This script is provided by Doc ID 401749.1 from My Oracle Support
# http://support.oracle.com
# Welcome text
echo "
This script is provided by Doc ID 401749.1 from My Oracle Support
(http://support.oracle.com) where it is intended to compute values for
the recommended HugePages/HugeTLB configuration for the current shared
memory segments. Before proceeding with the execution please make sure
that:
* Oracle Database instance(s) are up and running
* Oracle Database 11g Automatic Memory Management (AMM) is not setup
(See Doc ID 749851.1)
* The shared memory segments can be listed by command:
# ipcs -m
Press Enter to proceed..."
read
# Check for the kernel version
KERN=`uname -r | awk -F. '{ printf("%d.%d\n",$1,$2); }'`
# Find out the HugePage size
HPG_SZ=`grep Hugepagesize /proc/meminfo | awk '{print $2}'`
# Initialize the counter
NUM_PG=0
# Cumulative number of pages required to handle the running shared memory segments
for SEG_BYTES in `ipcs -m | awk '{print $5}' | grep "[0-9][0-9]*"`
do
MIN_PG=`echo "$SEG_BYTES/($HPG_SZ*1024)" | bc -q`
if [ $MIN_PG -gt 0 ]; then
NUM_PG=`echo "$NUM_PG+$MIN_PG+1" | bc -q`
fi
done
RES_BYTES=`echo "$NUM_PG * $HPG_SZ * 1024" | bc -q`
# An SGA less than 100MB does not make sense
# Bail out if that is the case
if [ $RES_BYTES -lt 100000000 ]; then
echo "***********"
echo "** ERROR **"
echo "***********"
echo "Sorry! There are not enough total of shared memory segments allocated for
HugePages configuration. HugePages can only be used for shared memory segments
that you can list by command:
# ipcs -m
of a size that can match an Oracle Database SGA. Please make sure that:
* Oracle Database instance is up and running
* Oracle Database 11g Automatic Memory Management (AMM) is not configured"
exit 1
fi
# Finish with results
case $KERN in
'2.4') HUGETLB_POOL=`echo "$NUM_PG*$HPG_SZ/1024" | bc -q`;
echo "Recommended setting: vm.hugetlb_pool = $HUGETLB_POOL" ;;
'2.6') echo "Recommended setting: vm.nr_hugepages = $NUM_PG" ;;
*) echo "Unrecognized kernel version $KERN. Exiting." ;;
esac
# End
2. 关闭所有oracle实例
3. 用root设定oracle memlock limit,设置一个较大的数值或者unlimited
在/etc/security/limits.conf最后添加(如:设置pagesize为110000 pages,则limit=11000*2M*1824 ,其中)
oracle hard memlock unlimited
oracle soft memlock unlimited
补充:关于memlock的一点描述:如果内存中含有私人秘密,这秘密可能最终被页面调度以不加密的方式储存到硬盘上。
例如,如果一个用户的私人密钥正 常情况下是以加密的方式保存在磁盘上的,一个在内存中为加密的密钥备份最后保存在了交换文件中。在一个高度注重安全的环境中,这样做可能是不能被接受的。 这样的应用程序可以请求将密钥一直保留在物理内存上。当然,改变内核的行为会导致系统整体性能的负面影响。当页面被锁定在内存中,一个应用程序的安全性可 能提高了,但这能使得另外一个应用程序的页面被交换出去。如果内核的设计是值得信任的,它总是最优地将页面交换出去(看上去将来最不会被使用的页面)。
4. 分配hugepages内存
#在/etc/sysctl.conf中添加
vm.nr_hugepages=11000
#在RHEL4中 是直接设置hugepage的页数. 每页大小为2M,
执行sysctl -p使其生效。这时候内存就已经被分配了,可以查看meminfo
grep Huge /proc/meminfo
HugePages_Total为设定的值大小,HugePages_Free应该和HugePages_Total一样大,HugePages_Rsvd为0.
5. 启动Oracle instance
这时候再次查看meminfo
HugePages_Total为设定的值大小不变,HugePages_Free有所降低,HugePages_Rsvd为一个较大的数值(因为刚刚启动时,大部分SGA被分配但是没有被使用到)。
如果Hugepages没有被使用,可能一些memory page被分配为4k大小了,那么需要重启server来设置。
从我们的测试结果看,Hugepages可以提高OLTP系统10%的吞吐量,当然不同的数据库应用结果可能不同,但是总体来说这是一个nice to have的设置
查看SGA总和:
SQL> show sga
Total System Global Area 171966464 bytes
Fixed Size 787988 bytes
Variable Size 145750508 bytes
Database Buffers 25165824 bytes
Redo Buffers 262144 bytes
--查询总和
select sum(value)/1024/1024 "total sga md" from v$sga;
相关推荐
1. 透明HugePage:无需应用程序修改,系统自动将小页合并为大页。THP可以通过内核配置启用或禁用,但可能会影响特定应用的性能。 2. 非透明HugePage:应用程序需显式地分配和管理HugePage。这种方式更适合对性能有...
Oracle发展这么多年,提供了多种的内存管理方式,从最早SGA、PGA手工管理,到9I版本出现的PGA的自动管理,到10G版本出现的SGA自动管理(ASMM),再到11G版本出现的memory自动管理(AMM),Oracle基本是在朝着智能化、...
在Linux系统中,HugePages是一种优化内存...通过以上步骤,您应该能在Linux系统上成功配置HugePages,从而提升Oracle数据库等需要大内存的应用的性能。记得在配置过程中密切监控系统的内存使用情况,确保系统稳定运行。
接下来详细介绍如何在 Linux 系统上为 Oracle 数据库配置 Hugepage。 1. **理论介绍** 对于 Oracle 11g 数据库,为了启用 Hugepage 功能,需要进行一些额外的配置。特别是当使用的是 AMM 时,需要将其退化为 ASMM...
在本文中,沃趣科技高级数据库工程师魏兴华讲解了关于Oracle数据库在10G版本之前的SGA(系统全局区)管理机制,并介绍了使用自动内存管理(Automatic Memory Management, AMM)和大页面(HugePage)技术的优势。...
还包括调整网络堆栈以降低网络延迟,优化文件系统设置以提高读写速度,以及考虑使用透明大页(Transparent Huge Pages)来提升内存访问效率。 总之,为Oracle调整和优化Linux涉及到多个层面,包括硬件、内核、内存...
3. 配置GRUB:需要在GRUB配置文件中添加transparent_hugepage=never以禁用透明大页。 4. 禁用avahi-daemon:avahi-daemon可能会干扰Oracle的安装,因此需要禁用它。 二、安装Grid Infrastructure 1. 安装Grid ...
禁用THP可以通过内核参数`transparent_hugepage`进行,确保在启动时设置为`never`或通过命令`echo never > /sys/kernel/mm/transparent_hugepage/enabled`来关闭。开启HugePages则涉及到内核参数的设置,比如`vm.max...
接着,配置`memlock`限制以允许Oracle使用足够的内存。 ```bash # vi /etc/security/limits.conf oracle hard memlock 67313664 oracle soft memlock 67313664 ``` 这里的67313664 KB是基于64GB SGA大小计算出的`...
在安装 Oracle 19c RAC 之前,需要关闭 THP(Transparent Huge Pages)和开启 Hugepages。THP 可能会影响 Oracle 数据库的性能,因此需要关闭它。同时,开启 Hugepages 可以提高 Oracle 数据库的性能。 安装软件包 ...
- 另外,查看`/sys/kernel/mm/redhat_transparent_hugepage/enabled`文件,如果内容为`[always] madvise never`,且"never"在括号内,表明透明大页已禁用。 2. **关闭透明大页** - Oracle官方推荐关闭THP以避免...
可以查看 `/sys/kernel/mm/transparent_hugepage/enabled` 文件确认其状态,如果显示 "always",则需要将其更改为 "never"。 在完成上述系统级别的准备后,可以开始安装 Oracle 11g。这通常涉及解压安装文件,运行...
- 关闭透明大页和NUMA的步骤通常包括编辑Grub配置文件(grub.conf或grub2.cfg)以及修改sysctl参数,如设置transparent_hugepage/enabled为never。 5. Oracle RAC和Oracle Grid Infrastructure安装: - Oracle ...
在Linux操作系统上部署Oracle 19c RAC环境是一个复杂的工程项目,需要对系统进行一系列的配置和优化以确保其稳定运行。以下将详细介绍Oracle 19c RAC在Linux 7.6环境下安装过程中必须了解的知识点。 1. OS环境检查...
2. **修改文件关闭THP**:通过编辑`/sys/kernel/mm/transparent_hugepage/enabled`和`/sys/kernel/mm/transparent_hugepage/defrag`,设置为禁用。 3. **确认THP关闭**:重启系统后验证THP功能是否已关闭。 4. **...
在安装Oracle之前,建议将其设置为disabled,以避免安装过程中因安全策略导致的权限问题。 3. 禁用Transparent Huge Pages(THP) - THP是Linux内核中的一个特性,其目的是提高内存管理效率,但可能会对Oracle...
在 Ubuntu Server 14.04 (Kernel 3.13.0-45) 上,可以使用以下命令为 Hugepage 分配内存: ```bash $ sudo sysctl vm.nr_hugepages=128 ``` 这将设置128个Hugepages,每个大小为2MB。随后,可以检查 `/proc/...
Oracle 12c 集群安装是指在 Linux 操作系统上安装 Oracle 12c 数据库软件,并将其配置为集群模式,以实现高可用性和负载均衡。以下是 Oracle 12c 集群安装的详细步骤和知识点: 1. 操作系统安装 * 安装操作系统...