需求定义:
近期中国银监会出台了《商业银行信息科技风险管理指引》要求“商业银行在信息系统开发、测试和维护,以及服务外包过程中加强对客户信息的保护,防止敏感信息的泄漏。”为保护客户权益,满足商业银行风险监管和内控监管的要求,银行需要对开发环境和测试环境中的数据建立统一的管理规范,对于必须使用生产数据的系统开发、测试、维护项目,生产数据必须经过脱密,才能被加载到开发、测试或维护环境。此脱密过程称做“数据漂白”。
测试,开发,培训,外包,数据挖掘、研究等,在非生产环境中使用生产数据,减少数据使用的限制,就必须保证数据中涉及客户和生产的敏感信息不外泄。例如:客户姓名、电话、住址、身份证号码等个人敏感信息;还有员工类和企业类的敏感信息等。如果这些客户信息泄漏会对银行本身造城不可估量的损失,如果有人以此客户数据牟利,轻则会损失重要的客户资源,重则造成严重的社会问题。在加强金融行业监管的背景下,从萨班斯法案到《企业内部控制基本规范》都明确要求金融机构中规避信息风险,对客户等资产安全,敏感信息提供完善的保护。因此如何去除数据中的敏感信息,又不改变数据的完整性和一致性,是一个数据安全管理需要解决的问题。数据漂白就是通过数据变换的方法,去除数据中的敏感信息。不同于数据加密,数据漂白可以是不可逆的过程;
一个好的数据漂白过程必须要具备以下特点:
- 数据仿真度
- 数据关联关系
-
业务规则关系
- 可定制
数据仿真度是指漂白过的数据看起来要像真实数据,并且具有真实数据的合法性。例如:姓名漂白过之后,看起来还应该是一个姓名;如果变成一串无意义的字符串,会让使用者很不习惯。
数据关联关系指的是数据库内的数据关联关系,这种关联关系通常是可见的,能够从数据库中找到。例如:主外键的关联关系。在漂白的时候,须保证数据关联的完整性、一致性。
业务规则关系是指数据在数据库之外的业务约束关系,即业务上对数据的约束关系,这种约束关系由业务系统的设计方提供,数据库中不会有所体现。例如:业务规则要求某个字段有一个检验字段,校验字段是通过一个算法计算出的值。此时如果漂白了这个字段,而没有考虑校验关系,就会导致漂白过的数据不可用。还有出生日期与身份证是否具有对应关系等等。
数据漂白面临的问题
目前金融企业一般数据量都比较大,对数据漂白方法也是一个挑战,一种漂白方法对小数据量没有问题,一旦上规模就会可能会出现问题。
例如:数据规模大就会涉及到数据分块,多任务拆分处理。在漂白算法设计上,要保证算法不具有任务间的关联性,才能够保证多个任务之间相互独立,易于调度和处理。
此外还会涉及到多平台、数据编码、中文字符处理等常见问题,都需要在工具上、方法上予以很好的解决。 在数据漂白策略上,需要在数据完整性与通用性之间达成一个平衡。过度追求完整性会产生很多数据约束,再加上规模庞大,使漂白问题复杂性提高;最好的方案是针对目标需求,采用不同的漂白方案,这样会使问题简单化,易于解决。
数据漂白方法介绍
- 置换类算法,针对某些集合数据,通过置换的方法对数据进行漂白。生成类的方法,对email地址、电话号码等内容的漂白,可以通过算法随机生成相应的字段值,以达到漂白的目的
- 随机类方法,针对数字的部分,用随机数代替原有数字。
- 日期类方法,针对日期的变化,如果年龄等。
- 组合类方法,对身份证号可以通过对各个部分分别漂白,再合成为一个新的身份证号的。还需要考虑的是,如果身份证号本身又是一个用于链接的键,就必须保证键值的完整性。
分享到:
相关推荐
"测试数据管理与隐私数据漂白平台" 测试数据管理与隐私数据漂白平台是一种解决方案,旨在保护企业的敏感信息和个人数据,避免数据泄露和不当使用。该平台通过数据脱敏和数据漂白技术,确保测试数据的安全和隐私保护...
测试数据管理与隐私数据漂白解决方案 测试数据管理与隐私数据漂白解决方案是指在软件开发和测试过程中,对敏感数据进行保护和脱敏,以避免数据泄露和不正当使用。该解决方案主要涉及到测试数据管理、隐私数据漂白...
测试数据管理与隐私数据漂白平台白皮书.pdf是海量云图(北京)数据技术有限公司发布的一份白皮书,主要介绍了InfoMask产品的解决方案。该白皮书对信息安全的重要性进行了讨论,并对行业法规和挑战进行了分析,最后...
测试数据管理与隐私数据漂白平台是现代信息技术领域中一项至关重要的解决方案,旨在保障企业信息安全,遵循行业法规,应对日益严峻的数据安全挑战。本白皮书深入探讨了该平台的功能和设计原理,为企业提供了一套全面...
数据管理与隐私数据漂白平台建设方案.docx
InfoMask针对这些需求,提供了数据漂白服务,不同于加密,漂白是将真实数据转化为伪造数据,虽然数据仍为明文,但无法追溯到原始信息,有效切断了数据与特定个体的关联。漂白过程需遵循一定的原则,确保数据格式、...
隐私数据漂白平台旨在解决这些问题,通过一系列技术和流程,实现敏感数据的安全处理。主要包含以下几个核心组成部分: 1. 数据发现与分类:首先,平台需要能够识别出存储在数据库和文件系统中的敏感信息,如个人...
InfoMask一体机应运而生,它集成了数据抽取、私密数据漂白、测试数据管理和数据装载等功能,以流程化、自动化的方式运行,降低工作负担,提高数据安全性。 InfoMask的漂白技术主要是对敏感数据进行变形,使其无法...
### 银行测试数据管理与隐私数据漂白平台建设方案关键知识点 #### 一、建设背景 **重要性及紧迫性:** 随着银行业务规模的不断扩大和技术的应用日益广泛,银行内部积累了大量的敏感数据,包括但不限于账户信息、...
3. **漂白方法流程**:详细介绍该方法的具体操作步骤,包括数据预处理、数据漂白算法、后处理以及验证机制。 4. **设备与装置**:描述了在金融环境中,如何利用特定的硬件或软件设备执行数据漂白,比如专用的数据...
珊瑚分类数据集,数据集包含三个类。这些类别是健康的(720张)、漂白(150张)和死亡(712张)的珊瑚, 珊瑚分类数据集,数据集包含三个类。这些类别是健康的(720张)、漂白(150张)和死亡(712张)的珊瑚, 珊瑚...
这款一体机融合了多种功能,如数据发现、数据抽取、数据漂白、测试数据管理和数据装载,同时具备访问控制和性能监控,确保测试数据的业务完整性和有效性。 1. 数据发现:InfoSteganos配备自动发现功能,能扫描企业...
核心功能介绍包括数据发现、数据抽取、数据漂白、数据装载、数据监控和数据管理等六个方面。数据发现是自动扫描并定位企业中的敏感数据,并根据隐私数据算法确认隐私数据,以及隐私数据类型。数据抽取是根据生产数据...
9. 隐私数据漂白技术:隐私数据漂白技术是指对敏感数据进行变形处理,以保护数据的隐私和安全。例如,数据漂白可以对真实数据进行变形,形成仿真数据,以供开发和测试使用。 10. 数据脱敏一体机(InfoSteganos)...
根据提供的文件内容,以下是2020年...综上所述,这份报告是化工化学类化学助剂行业氯系漂白助剂领域的一份全面的市场分析,通过一系列的数据分析和图表呈现,为行业从业者和相关利益方提供了丰富的市场信息和趋势预测。
自定义关键字替换漂白函数就是一种用于保护敏感信息的技术,它允许我们按照预定义的规则替换特定的字符串,从而达到数据漂白的效果。本篇文章将详细解释如何使用这种自定义函数以及需要注意的事项。 首先,我们需要...
这些系统还可以通过数据分析,提供反馈和优化建议,帮助操作员和工程师持续改进漂白效率。 在经济方面,高效漂白方法和设备能降低生产成本,减少化学品消耗,并可能延长设备的使用寿命。同时,环保的漂白过程有助于...
这份报告详细分析了化工化学类化学助剂行业的氧系漂白助剂领域,...整体而言,这份报告为化学助剂行业的氧系漂白助剂领域提供了详尽的市场分析和深入的行业洞察,为相关从业者和决策者提供了重要的数据支持和决策参考。
通过实验数据分析,得出最佳的漂白方案。 三、实验材料与设备 实验所用叶腊石微粉取自浙江青田,主要化学成分包括SiO2、Al2O3、MgO、Na2O、K2O、TiO2和Fe2O3等。实验设备包括恒温磁力搅拌器、电子天平、电热恒温水...
通过这些测试数据,我们可以了解到该漂白剂相比于传统方法的优势,例如是否能实现更高的白度、更低的能耗,以及是否更易于生物降解。 总的来说,"一种纸浆漂白剂及其制备方法"的研究内容是造纸工业的前沿科技,它...