来源:http://server.51cto.com/sCollege-198840.htm
从系统架构来看,目前的商用服务器大体可以分为三类,即对称多处理器结构(SMP:Symmetric Multi-Processor),非一致存储访问结构(NUMA:Non-Uniform Memory Access),以及海量并行处理结构(MPP:Massive Parallel Processing)。它们的特征分别描述如下:
SMP(Symmetric Multi-Processor)
所谓对称多处理器结构,是指服务器中多个CPU对称工作,无主次或从属关系。各CPU共享相同的物理内存,每个CPU访问内存中的任何地址所需时间是相同的,因此SMP也被称为一致存储器访问结构(UMA:Uniform Memory Access)。
对SMP服务器进行扩展的方式包括增加内存、使用更快的CPU、增加CPU、扩充I/O(槽口数与总线数)以及添加更多的外部设备(通常是磁盘存储)。
SMP服务器的主要特征是共享,系统中所有资源(CPU、内存、I/O等)都是共享的。也正是由于这种特征,导致了SMP服务器的主要问题,那就是它的扩展能力非常有限。
对于SMP服务器而言,每一个共享的环节都可能造成SMP服务器扩展时的瓶颈,而最受限制的则是内存。由于每个CPU必须通过相同的内存总线访问相同的内存资源,因此随着CPU数量的增加,内存访问冲突将迅速增加,最终会造成CPU资源的浪费,使 CPU性能的有效性大大降低。
实验证明,SMP服务器CPU利用率最好的情况是2至4个CPU。
图1.SMP服务器CPU利用率状态
NUMA(Non-Uniform Memory Access)
由于SMP在扩展能力上的限制,人们开始探究如何进行有效地扩展从而构建大型系统的技术,NUMA就是这种努力下的结果之一。利用NUMA技术,可以把几十个CPU(甚至上百个CPU)组合在一个服务器内。其CPU模块结构如图2所示:
图2.NUMA服务器CPU模块结构
NUMA服务器的基本特征是具有多个CPU模块,每个CPU模块由多个CPU(如4个)组成,并且具有独立的本地内存、I/O槽口等。由于其节点之间可以通过互联模块(如称为Crossbar Switch)进行连接和信息交互,因此每个CPU可以访问整个系统的内存(这是NUMA系统与MPP系统的重要差别)。显然,访问本地内存的速度将远远高于访问远地内存(系统内其它节点的内存)的速度,这也是非一致存储访问NUMA的由来。
由于这个特点,为了更好地发挥系统性能,开发应用程序时需要尽量减少不同CPU模块之间的信息交互。利用NUMA技术,可以较好地解决原来SMP系统的扩展问题,在一个物理服务器内可以支持上百个CPU。比较典型的NUMA服务器的例子包括HP的Superdome、SUN15K、IBMp690等。
但NUMA技术同样有一定缺陷,由于访问远地内存的延时远远超过本地内存,因此当CPU数量增加时,系统性能无法线性增加。如HP公司发布Superdome服务器时,曾公布了它与HP其它UNIX服务器的相对性能值,结果发现,64路CPU的Superdome (NUMA结构)的相对性能值是20,而8路N4000(共享的SMP结构)的相对性能值是6.3。从这个结果可以看到,8倍数量的CPU换来的只是3倍性能的提升。
图3.MPP服务器架构图
MPP(Massive Parallel Processing)
和NUMA不同,MPP提供了另外一种进行系统扩展的方式,它由多个SMP服务器通过一定的节点互联网络进行连接,协同工作,完成相同的任务,从用户的角度来看是一个服务器系统。
其基本特征是由多个SMP服务器(每个SMP服务器称节点)通过节点互联网络连接而成,每个节点只访问自己的本地资源(内存、存储等),是一种完全无共享(Share Nothing)结构,因而扩展能力最好,理论上其扩展无限制,目前的技术可实现512个节点互联,数千个CPU。目前业界对节点互联网络暂无标准,如 NCR的Bynet,IBM的SPSwitch,它们都采用了不同的内部实现机制。但节点互联网仅供MPP服务器内部使用,对用户而言是透明的。
在MPP系统中,每个SMP节点也可以运行自己的操作系统、数据库等。但和NUMA不同的是,它不存在异地内存访问的问题。换言之,每个节点内的CPU不能访问另一个节点的内存。节点之间的信息交互是通过节点互联网络实现的,这个过程一般称为数据重分配(Data Redistribution)。
但是MPP服务器需要一种复杂的机制来调度和平衡各个节点的负载和并行处理过程。目前一些基于MPP技术的服务器往往通过系统级软件(如数据库)来屏蔽这种复杂性。举例来说,NCR的Teradata就是基于MPP技术的一个关系数据库软件,基于此数据库来开发应用时,不管后台服务器由多少个节点组成,开发人员所面对的都是同一个数据库系统,而不需要考虑如何调度其中某几个节点的负载。
NUMA与MPP的区别
从架构来看,NUMA与MPP具有许多相似之处:它们都由多个节点组成,每个节点都具有自己的CPU、内存、I/O,节点之间都可以通过节点互联机制进行信息交互。那么它们的区别在哪里?通过分析下面NUMA和MPP服务器的内部架构和工作原理不难发现其差异所在。
首先是节点互联机制不同,NUMA的节点互联机制是在同一个物理服务器内部实现的,当某个CPU需要进行远地内存访问时,它必须等待,这也是NUMA服务器无法实现CPU增加时性能线性扩展的主要原因。而MPP的节点互联机制是在不同的SMP服务器外部通过I/O 实现的,每个节点只访问本地内存和存储,节点之间的信息交互与节点本身的处理是并行进行的。因此MPP在增加节点时性能基本上可以实现线性扩展。
其次是内存访问机制不同。在NUMA服务器内部,任何一个CPU可以访问整个系统的内存,但远地访问的性能远远低于本地内存访问,因此在开发应用程序时应该尽量避免远地内存访问。在MPP服务器中,每个节点只访问本地内存,不存在远地内存访问的问题。
数据仓库的选择
哪种服务器更加适应数据仓库环境?这需要从数据仓库环境本身的负载特征入手。众所周知,典型的数据仓库环境具有大量复杂的数据处理和综合分析,要求系统具有很高的I/O处理能力,并且存储系统需要提供足够的I/O带宽与之匹配。而一个典型的OLTP系统则以联机事务处理为主,每个交易所涉及的数据不多,要求系统具有很高的事务处理能力,能够在单位时间里处理尽量多的交易。显然这两种应用环境的负载特征完全不同。
从NUMA架构来看,它可以在一个物理服务器内集成许多CPU,使系统具有较高的事务处理能力,由于远地内存访问时延远长于本地内存访问,因此需要尽量减少不同CPU模块之间的数据交互。显然,NUMA架构更适用于OLTP事务处理环境,当用于数据仓库环境时,由于大量复杂的数据处理必然导致大量的数据交互,将使CPU的利用率大大降低。
相对而言,MPP服务器架构的并行处理能力更优越,更适合于复杂的数据综合分析与处理环境。当然,它需要借助于支持MPP技术的关系数据库系统来屏蔽节点之间负载平衡与调度的复杂性。另外,这种并行处理能力也与节点互联网络有很大的关系。显然,适应于数据仓库环境的MPP服务器,其节点互联网络的I/O性能应该非常突出,才能充分发挥整个系统的性能。
相关推荐
服务器三大体系SMP、NUMA、MPP介绍 服务器三大体系SMP、NUMA、MPP是商用服务器架构的三大类别,它们分别指对称多处理器结构、非一致存储访问结构和海量并行处理结构。理解这三大体系对于服务器架构和性能优化非常...
### 服务器三大体系SMP、NUMA、MPP详解 #### SMP(Symmetric Multi-Processor 对称多处理器架构) **定义及特点** SMP架构是一种将多个处理器集成在同一服务器上,使得这些处理器能够平等地访问同一共享内存的技术...
服务器系统架构是构建高性能计算和数据中心的关键因素,主要包括对称多处理器结构(SMP)、非一致存储访问结构(NUMA)和海量并行处理结构(MPP)这三种类型。 1. 对称多处理器结构(SMP:Symmetric Multi-...
NUMA 技术有效结合了 SMP 系统易编程性和 MPP(大规模并行)系统易扩展性的特点,较好解决了 SMP 系统的可扩展性问题。 [NUMA 技术的特点] * NUMA 技术是一种解决 SMP 系统可扩展性问题的解决方案 * NUMA 技术可以...
在服务器系统技术方面,多处理器技术如SMP(对称多处理)、MPP(大规模并行处理)和NUMA(非统一内存访问)允许服务器利用多个处理器提高性能。SMP所有CPU共享资源,MPP使用分布式存储器模式,而NUMA中每个处理器...
本文档主要讲述了 HPC 高性能计算知识中的计算架构演进,涵盖了计算架构的发展史、MPI、OpenMPI 和 OpenMP 的概念区别、SMP、NUMA 和 MPP 等高性能计算架构模式的特征和优缺点。 计算架构演进 HPC 高性能计算系统...
CC-NUMA架构是一种广泛应用于多处理器系统的体系结构,其核心特点是兼顾了SMP的内存访问一致性与MPP的可扩展性。SMP模式中,所有处理器共享同一物理内存,虽然结构简单,但容易出现内存访问冲突,导致性能下降。而...
数据库理论基础中,服务器系统架构有SMP、NUMA和MPP三种。SMP所有CPU共享内存,访问速度一致;NUMA则允许CPU访问内存的路径不同,适应更复杂的多CPU扩展;MPP通过多台SMP服务器互联,形成大规模并行处理能力。在事务...
13. MPP:大规模并行处理,每个处理器拥有独立的内存和I/O,不共享资源,适合大数据处理。 14. SSE:因特网数据流单指令序列扩展,增强CPU处理多媒体和3D信息的能力。 15. 高级传输高速缓存:L2高速缓存,与CPU...
服务器的品牌,如Sun、IBM、HP、Compaq等,以及服务器的体系结构,如单CPU、SMP、NUMA、Cluster、MPP等,都会影响服务器的功能定位。 在市场趋势方面,Unix服务器以其高可靠性在大型、重要应用中占据优势,但价格较...
再到现在的多处理器技术,如AMP(Asymmetric Multi-Processing)、SMP(Symmetric Multi-Processing)、MPP(Massively Parallel Processing)、COMA(Connection Machine Architecture)、集群技术和NUMA(Non-...
3. MPP(Massively Parallel Processing):大规模并行处理,由大量独立的处理器通过高速网络互连,适用于超级计算。 4. COW(Cluster of Workstations):工作站集群,通过网络将多个工作站连接成一个系统,实现...
首先,MPP(大规模并行处理计算机)是通过大量通用微处理器构成的多处理机系统。这种结构特别适合处理多指令流和多数据流的任务,是现代高性能计算的典型代表。而SMP(对称多处理结构)则是一种在一个计算机上汇集一...
本复习资料中,我们探讨了多种计算模型和架构,如PVP、SMP、MPP、DSM、Cluster、Constellation以及UMA、NUMA、CC_NUMA、CORMA、NORMA等,同时也对比了HPC、HPCC和Cloud computing的概念。 1. PVP(并行向量处理机)...
3. 大规模并行处理(MPP):MPP采用分布式存储器,每个处理器都有独立的内存,扩展性好,但需要复杂的并行编程和编译,使用难度较大。 CC-NUMA(一致性缓存非均匀存储访问)是NUMA的一种改进,它引入高速缓存一致性...
MIMD则更为复杂,因为它允许每个处理器独立执行不同的指令,这包括并行向量处理机(PVP)、对称多处理机(SMP)、大规模并行处理机(MPP)、工作站机群(COW)以及分布式共享存储处理机(DSM)。 并行向量处理机...
节点机耦合程度分类法则依据处理器间的交互方式,MIMD又可以细分为PVP(并行向量处理机)、SMP(对称多处理机)、DSM(分布共享存储多处理机)、MPP(大规模并行处理机)和COW(工作站机群)。这些不同类型的并行...
- **大规模并行处理机(MPP)**:多个节点各自拥有独立的内存,通过网络连接进行通信。 - **分布式共享存储(DSM)**:通过高速网络连接多个节点,每个节点有自己的本地内存,但整体形成一个统一的内存空间。 - **工作站...