`
sunnylocus
  • 浏览: 875819 次
  • 性别: Icon_minigender_1
  • 来自: 美国图森
社区版块
存档分类
最新评论
阅读更多

需求定义:

       近期中国银监会出台了《商业银行信息科技风险管理指引》要求“商业银行在信息系统开发、测试和维护,以及服务外包过程中加强对客户信息的保护,防止敏感信息的泄漏。”为保护客户权益,满足商业银行风险监管和内控监管的要求,银行需要对开发环境和测试环境中的数据建立统一的管理规范,对于必须使用生产数据的系统开发、测试、维护项目,生产数据必须经过脱密,才能被加载到开发、测试或维护环境。此脱密过程称做“数据漂白”。

       测试,开发,培训,外包,数据挖掘、研究等,在非生产环境中使用生产数据,减少数据使用的限制,就必须保证数据中涉及客户和生产的敏感信息不外泄。例如:客户姓名、电话、住址、身份证号码等个人敏感信息;还有员工类和企业类的敏感信息等。如果这些客户信息泄漏会对银行本身造城不可估量的损失,如果有人以此客户数据牟利,轻则会损失重要的客户资源,重则造成严重的社会问题。在加强金融行业监管的背景下,从萨班斯法案到《企业内部控制基本规范》都明确要求金融机构中规避信息风险,对客户等资产安全,敏感信息提供完善的保护。因此如何去除数据中的敏感信息,又不改变数据的完整性和一致性,是一个数据安全管理需要解决的问题。数据漂白就是通过数据变换的方法,去除数据中的敏感信息。不同于数据加密,数据漂白可以是不可逆的过程;

一个好的数据漂白过程必须要具备以下特点:

  1. 数据仿真度 
  2. 数据关联关系
  3. 业务规则关系  
  4. 可定制

数据仿真度是指漂白过的数据看起来要像真实数据,并且具有真实数据的合法性。例如:姓名漂白过之后,看起来还应该是一个姓名;如果变成一串无意义的字符串,会让使用者很不习惯。

数据关联关系指的是数据库内的数据关联关系,这种关联关系通常是可见的,能够从数据库中找到。例如:主外键的关联关系。在漂白的时候,须保证数据关联的完整性、一致性。

业务规则关系是指数据在数据库之外的业务约束关系,即业务上对数据的约束关系,这种约束关系由业务系统的设计方提供,数据库中不会有所体现。例如:业务规则要求某个字段有一个检验字段,校验字段是通过一个算法计算出的值。此时如果漂白了这个字段,而没有考虑校验关系,就会导致漂白过的数据不可用。还有出生日期与身份证是否具有对应关系等等。  

 

数据漂白面临的问题

    目前金融企业一般数据量都比较大,对数据漂白方法也是一个挑战,一种漂白方法对小数据量没有问题,一旦上规模就会可能会出现问题。

例如:数据规模大就会涉及到数据分块,多任务拆分处理。在漂白算法设计上,要保证算法不具有任务间的关联性,才能够保证多个任务之间相互独立,易于调度和处理。

此外还会涉及到多平台、数据编码、中文字符处理等常见问题,都需要在工具上、方法上予以很好的解决。 在数据漂白策略上,需要在数据完整性与通用性之间达成一个平衡。过度追求完整性会产生很多数据约束,再加上规模庞大,使漂白问题复杂性提高;最好的方案是针对目标需求,采用不同的漂白方案,这样会使问题简单化,易于解决。

数据漂白方法介绍

  • 置换类算法,针对某些集合数据,通过置换的方法对数据进行漂白。生成类的方法,对email地址、电话号码等内容的漂白,可以通过算法随机生成相应的字段值,以达到漂白的目的
  • 随机类方法,针对数字的部分,用随机数代替原有数字。
  • 日期类方法,针对日期的变化,如果年龄等。
  • 组合类方法,对身份证号可以通过对各个部分分别漂白,再合成为一个新的身份证号的。还需要考虑的是,如果身份证号本身又是一个用于链接的键,就必须保证键值的完整性。
分享到:
评论
14 楼 sunnylocus 2011-03-09  
liu_yi126 写道
现在银行测试都是模拟环境进行数据的生成。用真实数据在进行漂白。工作量更大。也更复杂。

模拟环境是一个不错的选择,地方性银行实力有限没有这些环境,一般都是拿生产上的数据去折腾。
13 楼 liu_yi126 2011-03-09  
现在银行测试都是模拟环境进行数据的生成。用真实数据在进行漂白。工作量更大。也更复杂。
12 楼 jiangduxi 2011-03-04  
sunnylocus 写道
呵呵,不深奥。
测试数据自动生成的只能做些基本的数据校验,如字段非空验证,数据格式、长度验证等等。
举一个例子:
  你在某银行有一笔巨额存款,那么你的个人信息及存款信息会被录入到银行的核心系统里,有你的姓名,身份证号,电话号码,住址,E-mail等等,银行可能因为业务需要开发一个外围系统,通常情况下会将项目外包给软件外包商,软件外包商在开发测试期间肯定需要进行业务测试的,如果不将数据作下处理,你的个人信息会被测试人员,开发人员全部看到,你的隐私暴露无疑,如果有人把你的信息给了另外一个银行的业务人员,给你诸多便利让你把钱存入他们的银行,这样会对原来的银行的储蓄造成损失。另外一方面,你个人信息的泄漏,会招来一大群骗子。所以数据必须进行漂白的.


其实我感觉真不如人家ebay,paypal那样做,直接来个sandbox。进行测试。无需进行数据漂白,漂白我个人还是认为是测试的时候根据规则随机产生出来的数据。
11 楼 lsk 2011-03-03  
landslide 写道
漂白的话.. 

数据格式如此正规,何不做数据字段的互相替换

腿真不错..
10 楼 sunnylocus 2011-03-01  
volking 写道
楼主真黑。。。

黑了健康哇
9 楼 volking 2011-03-01  
楼主真黑。。。
8 楼 sunnylocus 2011-02-28  
呵呵,不深奥。
测试数据自动生成的只能做些基本的数据校验,如字段非空验证,数据格式、长度验证等等。
举一个例子:
  你在某银行有一笔巨额存款,那么你的个人信息及存款信息会被录入到银行的核心系统里,有你的姓名,身份证号,电话号码,住址,E-mail等等,银行可能因为业务需要开发一个外围系统,通常情况下会将项目外包给软件外包商,软件外包商在开发测试期间肯定需要进行业务测试的,如果不将数据作下处理,你的个人信息会被测试人员,开发人员全部看到,你的隐私暴露无疑,如果有人把你的信息给了另外一个银行的业务人员,给你诸多便利让你把钱存入他们的银行,这样会对原来的银行的储蓄造成损失。另外一方面,你个人信息的泄漏,会招来一大群骗子。所以数据必须进行漂白的.
7 楼 faye.feelcool 2011-02-28  
很深奥,很玄妙。
个人理解,所谓的漂白和测试数据自动生成本质上没有区别。
唯一的区别是,一个没有采样数据,一个有采样数据。也就是说自动生成测试数据没有样例数据,需要通过一定的规则来生成,而你的“漂白”是有一定的样例数据,来进行重新生成。

也就是说“漂白” 不仅有规则,还有example。相当于 有生成规则还有 input。

难题我想不在生成,而是生成后,让人看起来还有点真实意味。我想主要还是在于对汉字的处理上吧,让人读的真实就必须符合一定的汉字语法。
6 楼 landslide 2011-02-28  
漂白的话.. 

数据格式如此正规,何不做数据字段的互相替换
5 楼 bureaucrat 2011-02-25  
我现在就遇到这样的问题,好多 defect 都是因为客户提供的混淆过的 dummy 数据引起的
4 楼 sunnylocus 2011-02-25  
bureaucrat 写道
数据有关联的,比如身份证号什么的,测试起来比较麻烦,case 很多

是呀,如果只是主外键关联的话都用同一个置换算法即可,这样数据处理完成后关联关系还存在,如果是某种业务上的关联那就麻烦了。
3 楼 bureaucrat 2011-02-25  
数据有关联的,比如身份证号什么的,测试起来比较麻烦,case 很多
2 楼 sunnylocus 2011-02-21  
bureaucrat 写道
用随机数代替原有数字,怎么保证逻辑性以及和真实数据的相似度?

随机算法肯定是不能满足的,如果数据与数据之间没有关联就可以采用随机。
对数据有关联的用置换类方法,没关联也没有格式要求的就直接用随机
1 楼 bureaucrat 2011-02-21  
用随机数代替原有数字,怎么保证逻辑性以及和真实数据的相似度?

相关推荐

    测试数据管理与隐私数据漂白平台.pptx

    "测试数据管理与隐私数据漂白平台" 测试数据管理与隐私数据漂白平台是一种解决方案,旨在保护企业的敏感信息和个人数据,避免数据泄露和不当使用。该平台通过数据脱敏和数据漂白技术,确保测试数据的安全和隐私保护...

    测试数据管理与隐私数据漂白解决方案.pptx

    测试数据管理与隐私数据漂白解决方案 测试数据管理与隐私数据漂白解决方案是指在软件开发和测试过程中,对敏感数据进行保护和脱敏,以避免数据泄露和不正当使用。该解决方案主要涉及到测试数据管理、隐私数据漂白...

    测试数据管理与隐私数据漂白平台白皮书.pdf

    测试数据管理与隐私数据漂白平台白皮书.pdf是海量云图(北京)数据技术有限公司发布的一份白皮书,主要介绍了InfoMask产品的解决方案。该白皮书对信息安全的重要性进行了讨论,并对行业法规和挑战进行了分析,最后...

    测试数据管理与隐私数据漂白平台白皮书.docx

    测试数据管理与隐私数据漂白平台是现代信息技术领域中一项至关重要的解决方案,旨在保障企业信息安全,遵循行业法规,应对日益严峻的数据安全挑战。本白皮书深入探讨了该平台的功能和设计原理,为企业提供了一套全面...

    数据管理与隐私数据漂白平台建设方案.docx

    数据管理与隐私数据漂白平台建设方案.docx

    InfoMask数据管理与漂白一体机介绍.pdf

    InfoMask针对这些需求,提供了数据漂白服务,不同于加密,漂白是将真实数据转化为伪造数据,虽然数据仍为明文,但无法追溯到原始信息,有效切断了数据与特定个体的关联。漂白过程需遵循一定的原则,确保数据格式、...

    隐私数据漂白平台建设方案.docx

    隐私数据漂白平台旨在解决这些问题,通过一系列技术和流程,实现敏感数据的安全处理。主要包含以下几个核心组成部分: 1. 数据发现与分类:首先,平台需要能够识别出存储在数据库和文件系统中的敏感信息,如个人...

    InfoMask数据管理与漂白一体机介绍.pptx

    InfoMask一体机应运而生,它集成了数据抽取、私密数据漂白、测试数据管理和数据装载等功能,以流程化、自动化的方式运行,降低工作负担,提高数据安全性。 InfoMask的漂白技术主要是对敏感数据进行变形,使其无法...

    银行测试数据管理与隐私数据漂白平台建设方案.docx

    ### 银行测试数据管理与隐私数据漂白平台建设方案关键知识点 #### 一、建设背景 **重要性及紧迫性:** 随着银行业务规模的不断扩大和技术的应用日益广泛,银行内部积累了大量的敏感数据,包括但不限于账户信息、...

    行业分类-设备装置-一种金融数据的漂白方法.zip

    3. **漂白方法流程**:详细介绍该方法的具体操作步骤,包括数据预处理、数据漂白算法、后处理以及验证机制。 4. **设备与装置**:描述了在金融环境中,如何利用特定的硬件或软件设备执行数据漂白,比如专用的数据...

    深度学习-珊瑚分类数据集

    珊瑚分类数据集,数据集包含三个类。这些类别是健康的(720张)、漂白(150张)和死亡(712张)的珊瑚, 珊瑚分类数据集,数据集包含三个类。这些类别是健康的(720张)、漂白(150张)和死亡(712张)的珊瑚, 珊瑚...

    InfoSteganos数据脱敏一体机介绍.pdf

    这款一体机融合了多种功能,如数据发现、数据抽取、数据漂白、测试数据管理和数据装载,同时具备访问控制和性能监控,确保测试数据的业务完整性和有效性。 1. 数据发现:InfoSteganos配备自动发现功能,能扫描企业...

    企业数据脱敏一体机白皮书.docx

    核心功能介绍包括数据发现、数据抽取、数据漂白、数据装载、数据监控和数据管理等六个方面。数据发现是自动扫描并定位企业中的敏感数据,并根据隐私数据算法确认隐私数据,以及隐私数据类型。数据抽取是根据生产数据...

    数据脱敏一体机解决方案.pptx

    9. 隐私数据漂白技术:隐私数据漂白技术是指对敏感数据进行变形处理,以保护数据的隐私和安全。例如,数据漂白可以对真实数据进行变形,形成仿真数据,以供开发和测试使用。 10. 数据脱敏一体机(InfoSteganos)...

    2020年化工化学化学助剂行业氯系漂白助剂领域行业分析报告(市场调查报告).pdf

    根据提供的文件内容,以下是2020年...综上所述,这份报告是化工化学类化学助剂行业氯系漂白助剂领域的一份全面的市场分析,通过一系列的数据分析和图表呈现,为行业从业者和相关利益方提供了丰富的市场信息和趋势预测。

    自定义关键字替换漂白函数使用说.pdf

    自定义关键字替换漂白函数就是一种用于保护敏感信息的技术,它允许我们按照预定义的规则替换特定的字符串,从而达到数据漂白的效果。本篇文章将详细解释如何使用这种自定义函数以及需要注意的事项。 首先,我们需要...

    行业文档-设计装置-控制废纸处理的漂白过程的方法及实施该方法的漂白设备.zip

    这些系统还可以通过数据分析,提供反馈和优化建议,帮助操作员和工程师持续改进漂白效率。 在经济方面,高效漂白方法和设备能降低生产成本,减少化学品消耗,并可能延长设备的使用寿命。同时,环保的漂白过程有助于...

    化工化学类化学助剂行业氧系漂白助剂领域分析报告(研究报告).pdf

    这份报告详细分析了化工化学类化学助剂行业的氧系漂白助剂领域,...整体而言,这份报告为化学助剂行业的氧系漂白助剂领域提供了详尽的市场分析和深入的行业洞察,为相关从业者和决策者提供了重要的数据支持和决策参考。

    叶腊石微粉漂白实验研究

    通过实验数据分析,得出最佳的漂白方案。 三、实验材料与设备 实验所用叶腊石微粉取自浙江青田,主要化学成分包括SiO2、Al2O3、MgO、Na2O、K2O、TiO2和Fe2O3等。实验设备包括恒温磁力搅拌器、电子天平、电热恒温水...

    行业文档-设计装置-一种纸浆漂白剂及其制备方法.zip

    通过这些测试数据,我们可以了解到该漂白剂相比于传统方法的优势,例如是否能实现更高的白度、更低的能耗,以及是否更易于生物降解。 总的来说,"一种纸浆漂白剂及其制备方法"的研究内容是造纸工业的前沿科技,它...

Global site tag (gtag.js) - Google Analytics