`

SQLServer 2005 之 海量数据解决方案 分区表

阅读更多
http://www.cnblogs.com/yizhu2000/archive/2007/12/13/992901.html

Csdn Blog在2007年,由于访问量和数据量的大幅度增长,使得我们原有的在.text 0.96版本上修改的代码基本不堪重负。

在数据库方面主要表现为,单单文章表,2007年1年的数据已经达到了30G的量(最后的解决方案是对把文章表分为两个表,分别存放文章相关信息和专门存放文章内容的表,然后对两个表作分区)。熟悉.Text得朋友可能知道,有一个专门记录流量的表,页面内的每一次点击,直接记录到数据库里面,反映到页面上就是单个用户的博客流量,分别是EntryID,BlogID,DateTime,表名称叫做blog_viewcount,这个表我们现在已经到了4亿的数据,之前仅仅是优化索引和索引试图来在真实的环境中查看到底sql2005单表能负载多大的量。
最后得出结论,在sql2005中,单表的量最多不能超过200w数据。

而文章表和blog_viewcount这个表,我们现在采用2005得新特性,分区表来实现。事实上,反映还不错。以下写出创建分区表的步鄹(我们用blog_viewcount来做实例):

先根据表数据的量大小,来拆分每一个分区,保证分区之间在200w以下的数据
CREATE PARTITION FUNCTION OneYearDateRangePFN(datetime)
AS RANGE LEFT FOR VALUES
(
'20070131 23:59:59.997',
'20070228 23:59:59.997',
'20070331 23:59:59.997',
'20070430 23:59:59.997',
'20070531 23:59:59.997',
'20070630 23:59:59.997',
'20070731 23:59:59.997',
'20070831 23:59:59.997',
'20070930 23:59:59.997',
'20071031 23:59:59.997',
'20071130 23:59:59.997',
'20071231 23:59:59.997'
)


然后我们需要添加相应的文件组
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200701]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200702]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200703]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200704]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200705]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200706]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200707]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200708]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200709]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200710]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200711]
ALTER DATABASE newcsdnblog ADD FILEGROUP [ViewCount200712]



第三步,我们需要在服务器上建立出单独的文件(涉及到的朋友可能知道,我们如果把文件分布在不同的磁盘上,可以最大限度的提高磁头的读写能力;另:这里微软建议数据库服务器最好作Raid0 + Raid1)
ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200701',FILENAME = N'f:SmallTableViewCount200701.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200701]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200702',FILENAME = N'f:SmallTableViewCount200702.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200702]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200703',FILENAME = N'f:SmallTableViewCount200703.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200703]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200704',FILENAME = N'f:SmallTableViewCount200704.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200704]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200705',FILENAME = N'f:SmallTableViewCount200705.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200705]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200706',FILENAME = N'f:SmallTableViewCount200706.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200706]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200707',FILENAME = N'f:SmallTableViewCount200707.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200707]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200708',FILENAME = N'f:SmallTableViewCount200708.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200708]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200709',FILENAME = N'f:SmallTableViewCount200709.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200709]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200710',FILENAME = N'f:SmallTableViewCount200710.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200710]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200711',FILENAME = N'f:SmallTableViewCount200711.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200711]

ALTER DATABASE newcsdnblog
ADD FILE
(NAME = N'ViewCount200712',FILENAME = N'f:SmallTableViewCount200712.ndf',SIZE = 5MB,MAXSIZE = 100MB,FILEGROWTH = 5MB)
TO FILEGROUP [ViewCount200712]

第四步,创建关联
CREATE PARTITION SCHEME OneYearDateRangePScheme
AS
PARTITION OneYearDateRangePFN
ALL TO ([PRIMARY])

第五步,创建表和索引(我这里只列出如何创建表)
CREATE TABLE [dbo].[Blog_ViewCount2] 
(
[EntryID] [int] NOT NULL,
[BlogID] [int] NOT NULL,
[ViewDate] [datetime] NOT NULL
)
ON OneYearDateRangePScheme (ViewDate)
GO

如果大家希望查询此表中的相关数据,可以使用如下语句
select $partition.OneYearDateRangePFN(ViewDate) from [Blog_ViewCount2] a order by a.ViewDate asc

关于增量问题,我会在下一篇文章中,和大家分享。

参考资料:
http://www.microsoft.com/china/msdn/library/data/sqlserver/sql2k5partition.mspx?mfr=true
http://www.builder.com.cn/2007/0724/436577.shtml
http://www.agilelabs.cn/blogs/woody/archive/2006/08/24/1574.aspx
http://net.stuun.cn/database/Mssql/jiqiao/39408.html

文章转自:http://blog.csdn.net/PrideRock/archive/2007/12/07/1922538.aspx


朱燚的技术博客,转载请注明出处


http://yizhu2000.cnblogs.com

http://blog.csdn.net/yizhu2000
分享到:
评论

相关推荐

    SQL Server 2005海量数据处理

    对海量数据的处理一直是一个令人头痛的...SQL Server 2005新增的表分区功能,可以对数据进行合理分区,当用户在访问部分数据时,SQL Server最佳化引擎可以根据数据的实体存放,找出最佳的执行方案,而不至于大海捞针。

    SQL Server 2005对海量数据的处理

    【SQL Server 2005对海量数据的处理】 SQL Server 2005作为微软推出的数据库平台,针对大规模数据的处理提供了强大的支持。在处理海量数据时,SQL Server 2005引入了多项优化策略,特别是表分区技术,以提高数据库...

    物流信息网 SQLServer

    此外,SQL Server 2005引入了分区表,使得大规模数据的管理更为高效,这对于处理物流行业中海量的订单、车辆、路线等信息至关重要。 其次,SQL Server 2005在查询性能方面表现出色。其内置的Transact-SQL(T-SQL)...

    海量数据库解决方案

    "海量数据库解决方案"这个主题正是针对这一问题展开的讨论。在这个领域,我们需要关注以下几个关键知识点: 1. 数据仓库与大数据平台:传统的数据库系统往往难以应对大规模的数据存储和处理需求。因此,引入数据...

    SQLSERVER2005中文版教程与案例解析

    SQL Server 2005引入了诸多性能优化特性,如索引视图、分区表、并行查询等。 2. SQL Server Agent:这是一个用于计划任务和自动执行数据库维护工作的组件。它可以安排作业、警报和操作员通知,确保数据库的日常维护...

    海量图像数据在SQL Server2000环境下的存储.pdf

    SQL Server 2000支持最大数据库大小为4GB,不支持大容量的存储解决方案,如使用外部存储系统或文件组的方式管理大型数据。因此,在处理海量图像数据时,必须采取特定策略。 2. 二进制大对象(BLOB)的存储:在...

    SQL Server经典案例解析

    8. **大数据处理**:随着大数据的发展,SQL Server也支持大数据解决方案,如列存存储、分区技术等,这在处理海量数据时能显著提升性能。 通过这些案例,无论是初学者还是经验丰富的DBA,都能深入理解SQL Server的...

    SQL Server2005 BI系列课程之-销售管理中的智能化前端展现QA

    课程中提到的“20060817--BI综合案例系列课程(6):销售管理中的智能化前端展现.doc”文档,很可能是关于这一主题的详细案例分析,可能包含了如何使用SQL Server 2005的工具设计和实施销售管理BI解决方案的具体步骤。...

    SQL Server 2008 Analysis Services 概述白皮书

    SQL Server 2008 Analysis Services无缝集成于整个SQL Server平台,与其他组件如Integration Services(ETL工具)、Reporting Services和Master Data Services协同工作,共同构建完整的企业级商业智能解决方案。...

    sql server的具体介绍.txt

    3. **物联网和大数据**:面对物联网设备产生的海量数据,SQL Server 通过支持分区表、窗口函数等功能,能够有效处理和分析这些数据,提取有价值的信息。 4. **地理信息系统**:在地理信息系统中,SQL Server 能够...

    学生管理系统(SQL Server).rar

    SQL Server提供了大数据解决方案,如列式存储、分区表和并行数据处理,有效应对大数据挑战。 8. 高可用性:SQL Server支持多种高可用性技术,如镜像、复制和AlwaysOn Availability Groups,确保学生管理系统在任何...

    SQLServer2008新特性(QuickView)

    此外,SQL Server 2008还包括其他特性,如数据变化跟踪、同步编程模型、冲突检测、FILESTREAM数据类型、集成全文本搜索、稀疏列、巨大用户定义类型、LOCATION和SPATIAL数据类型、集成Virtual Earth、平行分区表查询...

    高并发网站解决方案.doc

    此外,随着技术的发展,微软的SQL Server 2005也被证实拥有处理海量数据的能力,尤其是在大数据分析项目中,其表现令人印象深刻。在BI(商业智能)领域,选择合适的ETL(数据抽取、转换、加载)工具和OLAP(在线分析...

    Oracle数据仓库解决方案

    - **Oracle8i的数据仓库新特性**:如高级SQL优化器、资源管理、分区表等,这些新特性大大提升了数据处理的速度和效率。 - **Oracle OLAP产品的新发展**:Oracle提供了先进的在线分析处理(OLAP)工具,如Oracle ...

    Oracle数据仓库解决方案.docx

    - **基于数据仓库的有效商务解决方案的要求**:为了实现上述目标,企业需要一个强大且灵活的数据仓库解决方案,该方案应能够支持海量数据的存储、管理和分析。 - **Oracle数据仓库:被证明是有实力的商务解决方案**...

    网易海量数据存储平台的构建和运维

    网易海量数据存储平台的设计目标是为博客、相册、邮箱、网盘、即时通讯(IM)等多种类型的互联网应用提供一个通用的数据存储和管理解决方案。其主要特征包括: 1. **海量存储空间**:能够支持PB级别的数据存储。 2. *...

Global site tag (gtag.js) - Google Analytics