目前,较普遍的归档应用只是简单地把备份数据保存很长时间,每周或每月不加选择地进行全数据备份,再根据商业要求保存几年甚至几十年。但是,归档与备份有本质的不同,因为归档的数据可能几个月甚至几年未被使用,而一旦需要时则必须尽快获取。在备份数据中寻找特定的信息不仅耗时,而且代价很高。将备份当作归档会带来许多问题。
备份系统用于归档的困境
首先,当用户需要查找几年前的一些相关资料时,就必须记住这些文件存放在什么地方。这不是一件容易的事,即使用户能记住,由于计算机平台和软件的日新月异,要找到当年的读取设备、操作系统和应用程序,甚至还需要访问权限去打开这些文件是相当费力的。
其次,用备份数据来满足电子发现的要求就更加困难。例如,公司要获取某个员工在3年前某两个月内从Exchange服务器上发出的所有电子邮件,或许可以花很长时间从备份系统中恢复特定时间内在Exchange服务器上保存过的电子邮件,但如果接收者在收到该员工电子邮件的同一天把它删除了,那么被删除的电子邮件就没能在当晚的备份作业中保存。因此,严格说来,即使找到了所有已备份的电子邮件,也不能符合电子发现的特定要求。
第三,恢复备份数据并进行查找会消耗大量时间和费用。试想一下,如果要把过去10年中满足某些条件的Exchange服务器上的电子邮件找出来,而公司每星期做一次备份,那么该公司的IT管理员就必须把每个恢复到Exchange服务器中的满足条件的电子邮件存入一个.pst文件,这样的手工作业至少要重复500多次。
此外,备份系统用于保存归档数据是相当低效的。一个归档系统对每个文件通常保存1~2份拷贝就足够了,而备份系统却没有这样的逻辑,特别是全备份系统,每次备份总是把未删除的旧数据又保存一次,浪费了很多存储空间。随着备份格式和磁带介质更新换代,许多企业耗费了相当大的精力进行设备升级和数据拷贝、迁移以及各种转换,同时又保留旧的备份格式和旧磁带上的数据,导致不同格式数据的许多副本分散在不同的设备和介质中,对这些数据进行有效管理和查询几乎不可能。
有效归档系统的特征
一个有效的归档系统最重要的特征是包含了足够多的元数据,并能通过逻辑方式获取信息。例如,一个电子邮件归档系统的元数据应至少包括发件人、收件人、主题、时间等信息,通常还会把电子邮件主体放入数据库用于全文搜索,甚至把附件的相关信息和关键词也提取出来作为元数据保存。
归档系统的另一个重要特征是能够保存预定数量的副本。例如,一个公司可以决定把一份归档数据存放在磁盘介质的存储设备中,把另一份相同的数据存放在光盘或磁带库里,以确保数据万无一失。
两类主要的归档系统
根据保存数据方式的不同,归档系统大致可分为两类。
一类是传统的依附于备份软件的归档系统,允许用户对所选择的文件进行归档,并把有限的元数据附加上去,然后把这些归档数据的备份文件删除,以减少重复数据。这种归档的缺陷在于,如果用户想通过不同的元数据查找归档信息,就必须建立几个附加不同元数据的归档文件。因此,这类系统基本上只适用于访问率较低的归档数据。
第二类归档系统意识到任何归档数据可能有不同的用途,因此需要用不同的元数据来描述。实现这类系统的关键在于对实际的归档数据只保存一份,而把所有的元数据都保存在可搜索的数据库中。这就是近年来逐渐兴起的内容寻址存储(CAS)。与第一类只在备份后才成为归档数据的归档系统不同,CAS归档系统对所有的数据都自动不间断地进行归档。一个文件或电子邮件一经产生,其中一个拷贝以及相关的元数据就被保存到归档系统中去。
CAS归档的另一个优势在于,使用了单一实例和增量保存的手段。它对所有的文件或电子邮件都只保存一个拷贝,当该文件或电子邮件被修改后再次发送和保存时,归档系统能够只保存变化的字节,因而极大地节省了磁盘空间,简化了管理。这种特性使CAS归档系统频繁地出现在分级存储管理和重复数据删除应用中。
CAS归档系统
国外主要的存储厂商如EMC和HP,以及一些初创企业如Bycast和Permabit等都相继推出了CAS归档产品。这些产品虽然技术路线相近,但各自的特点和针对的应用不尽相同。比如,HP RISS系统主要用于电子出件归档,而Bycast的方案局限于医疗影像的归档。国内归档市场才刚刚起步,也出现了一些归档产品。谷数科技的D-Mesh集群CAS系统可以满足多种归档的应用需求,其最显著的特点是内嵌了非结构化搜索引擎,极大地提高了元数据生成、管理和数据查找的效率,把归档技术推向一个新的高度。
分享到:
相关推荐
3. WinCC 归档备份功能 备份归档是WinCC的一项高级特性,它允许用户创建一个或多个附加的归档文件,这些文件可以在主归档满载后自动或手动切换。备份归档可以设置为循环模式,即旧的备份文件会被新的数据覆盖,以...
"ES备份归档操作说明" 本文档介绍了 ElasticSearch(ES)备份归档操作的详细步骤,包括创建新索引、执行 reindex、校验数据结果、索引迁移和删除原索引归档数据等操作的语句和示例。整个过程基于实际项目,在测试...
总结来说,ORACLE数据库的归档模式与备份恢复策略密切相关,ARCHIVELOG模式提供了更高级别的数据保护,而NOARCHIVELOG模式则适用于对数据恢复要求不高的场景。了解并合理运用这两种模式,对于保障数据库的安全运行至...
设计数据库自动备份功能;数据库由非归档模式调整为归档模式命令。
5. **备份服务器与L Legato Networker**:备份服务器使用Legato Networker平台进行定时备份,这是一款企业级的备份软件,可以管理各种不同类型的备份任务。 6. **虚拟磁带库SureSave VTL 1000**:SureSave VTL是...
运行这个脚本之后系统将会自动根据参数进行配置,会自动定时去备份数据及处理日志!数据库和日志都是一个月删除一次,本月的第一次成功完整备份后删除上一个月的数据,但日志会较数据库备份多存放一周! 运行脚本...
- 可结合归档备份恢复至最近状态。 - 维护简单,安全性高。 - **冷备份缺点** - 仅提供到某一时间点的恢复。 - 数据库必须处于关闭状态。 - 若磁盘空间有限,则需备份到外部存储,速度较慢。 - 无法按表或用户...
非归档模式下的冷备份与恢复是Oracle数据库管理中的一个重要环节。本文将详细介绍在非归档模式下如何进行冷备份及恢复操作,并基于提供的部分SQL命令进行深入解析。 ### 一、非归档模式简介 非归档模式是非归档...
Oracle数据库的归档备份是数据保护的重要环节,尤其对于企业级应用来说,确保数据的安全性和可恢复性至关重要。本文将针对初学者,详细介绍如何使用SQL语句进行Oracle数据库的归档备份,帮助你掌握这一核心技能。 ...
本文主要描述Oracle DB 在使用rman进行恢复时,如何利用rman注册备份集的方式达到主库和目标库数据一致的目的。当然Oracle数据库的话使用DG或ADG技术、或者rman的duplicate技术都是非常好的选择。
一:重做日志文件 oracle的重做日志文件,会记录数据库的任何操作,包括DML和DDL语句,数据结构的更改等. ...非归档模式只能做冷备份,归档模式可以做热备份并且可以做增量备份和部分恢复. 冷备份要关闭数据库。
Nginx日志自动归档备份shell脚本log
归档日志记录了数据库事务的详细信息,它们对于实现数据库的恢复和备份至关重要。但是,随着时间的推移,归档日志文件会不断增加,如果不进行适当的清理工作,将占据大量的磁盘空间,影响数据库性能。Oracle数据库中...
Oracle 备份策略详解 ...Oracle 备份策略是一种复杂的任务,需要根据不同的情况选择合适的备份方式,例如冷备份、热备份、逻辑备份等。数据库管理员需要根据实际情况选择合适的备份策略,确保数据库的安全性和可靠性。
VERITAS_NetBackup_6.0_备份、归档和恢复入门指南
7. **执行完全备份:** 最后,由于非归档模式下的备份日志不再适用于归档模式,因此需要执行一次完全备份,以确保新归档模式下的数据完整性。 #### 三、归档模式的实践意义 采用归档模式对于提高数据安全性、增强...
完整备份是对整个数据库的备份,包括所有数据文件、控制文件、归档日志文件和参数文件等。增量备份是对数据库的增量备份,包括自上一次备份以来被修改或添加的数据块。 二、RMAN 备份的类型 RMAN 备份可以分为以下...
归档3归档3归档3归档3归档3归档3归档3归档3
在操作站(Operation System, OS)中,还需要进一步设置归档的具体参数,包括但不限于归档容量、归档备份策略等。 ##### 1. 归档容量设置 归档容量的设置决定了每个归档文件的最大大小以及整个归档系统的最大容量...
这些工具都提供了丰富的参数选项,可以根据不同的需求定制备份策略。 #### 三、注意事项 在进行备份与恢复操作时,需要注意以下几点: - **备份频率**:根据业务需求合理安排备份计划,以确保数据的安全性。 - **...