中安威士数据静态脱敏系统(简称VS-DM-S)是一款由中安威士自主研发的数据遮蔽和仿真脱敏产品。该产品采用了一系列专有的数据脱敏规则,包括:数据遮蔽、数据仿真、关键部分替换、数据随机替换等,以达到隐藏或模糊处理真实敏感信息的目的,提高生产数据在应用开发、测试、以及第三方工具做数据分析等使用场景中的安全性。同时,脱敏后的数据能够保持原有的语义和关联关系,保证了数据的有效性。
数据抽取
本系统采用了灵活的数据抽取方式,既为所有数据库应用环境提供了通用模式的数据处理接口,又为部分数据库应用环境提供了基于极速模式的数据处理接口。这保证了本系统对于各式各样的数据库应用场景具备最大限度的兼容性,同时又能针对一些特定的应用场景开启技术模式,显著提升数据脱敏性能,提高脱敏业务的时效性。
数据发现
本系统能自动运行数据扫描任务,先从数据源中获取少量的样本数据,再与系统内置的敏感数据指纹特征进行比对,快速识别敏感数据类型,并记录敏感数据的存放位置。
本系统内置了数十种敏感数据发现规则,涵盖电力、金融、公安、社保、工商、税务等行业的数据特征识别需求。有些数据在特定应用场景中也会具备敏感性,对于这类脱敏需求,本系统提供了特征字典和正则表达两种数据匹配方式的配置接口,可根据情况自行定义。
数据脱敏
数据不落地:在执行数据抽取、脱敏计算、数据装载等任务时,不会在本地磁盘上记录任何数据,所有数据均只在内存中进行处理。
脱敏规则灵活丰富:可根据实际需要提供数据遮蔽、数据仿真、关键部分替换、随机字符串、重置固定值等多种多样的敏感数据处理方式,以达到隐藏或模糊处理真实敏感信息的目的,提高生产数据在应用开发、测试、以及第三方工具做数据分析等使用场景中的安全性。
数据的有效性和一致性:保证生产环境中的真实数据经过脱敏系统处理后,仍然保持原有的语义、长度和关联关系。脱敏后的数据在测试、分析场景中仍能具有可用性、规范性和“真实性”。相同的数据通过脱敏系统多次分发并写入到不同应用环境时,还可以保持一致性。同时,也不改变数据库中的数据。
数据对比
本脱敏系统提供脱敏前后数据校验功能,从数据库结构、数据对象、表数量、表内数据量等维度对比分析源库数据和目标库数据的差异。用户管理员可据此判断该脱敏任务是否胜利完成,脱敏方案是否合理。
数据上传
脱敏后的数据可以实时的上传到目标服务器,也可以保存在脱敏服务器上,按需的上传到目标服务器,实现一次脱敏多次使用。
适用场景和价值
本脱敏系统支持库到库、库到文件、文件到文件、文件到库、本地脱敏等多种数据脱敏场景。
强大的隐私发现功能
内置大量模板,满足中文环境下的金融、电力、税务、交通、公安、社保等多个行业对于敏感数据的识别特征要求。
灵活的数据源过滤
能够根据业务情况对需要脱敏的数据范围进行选择,提供库级、表级、列级、行数量级的多种层次的数据选择范围。同时提供where条件对原始数据过滤抽取后,进行脱敏,并写入到新的表中。比如只需对某张表中的几个数据字段和部分数据量进行脱敏,则可通过选择列,设置数据行数,设置过滤条件即可达成。
为了满足持续增长的业务数据脱敏需求,对具有自增主键或者带有时间戳的表提供了增量脱敏配置,结合定时的任务运行机制,保证写入的新数据能够及时的进行脱敏后,写入目标库。这样能保证开发、测试和大数据分析平台的数据和生产环境的数据保持实时同步。
强大的脱敏规则
数据仿真: 对数据内容进行仿真,生成格式&语义正确,但已经不是真实的高仿数据
数据遮蔽: 使用特殊字符对数据的遮蔽内容进行替换,破坏数据的可读性
随机字符串:对数据进行随机变化,使数据不保留原有的语义、格式
重置固定值: 对特定的数据列重置为固定的数字或者是字符串,比如密码列,可以重置为“88888888”
Hash(加密):对于完整的数据进行Hash加密,使数据不可读
列关联:保持列与列之间的对应或者运算关系,比如身份证字段和生日、年龄等
纵向乱序:保持或者打乱列与列之间的每行数据的对应关系
关联列计算:当列与列之间有运算关系时(比如A+B=C),脱敏后的数据仍然具有相同的运算关系
字典映射:根据特征字典,将符合特征的数据替换为指定的值,比如可以将所有的“张三”统一替换为“李四”
随机映射:根据特征字典,将符合特征的数据进行随机替换,比如可以将所有的“张三”替换为“李四、王五、赵六”当中的任意一个
关联性保持
脱敏前后,可以保持原始数据的关联关系。
高兼容性
支持数据库类型:Oracle、Mysql、MSSQL、DB2、Gbase8A/8T/8S、达梦、TreaData、PostgreSQL、GreenPlum等
支持大数据平台:HIVE、星环TDH等
支持:Linux、Windows、Unix、AIX等多种系统平台
支持格式化数据文件的脱敏:TXT、CSV、HDFS等
支持多种中文字符集:UTF-8、GBK、GB2312、Unicode等
支持不同存储位置的文件脱敏:FTP/SFTP
支持:异构数据库装载
高性能
高高性能,每小时不低于50GB的数据脱敏能力
高可靠性,服务器硬件平台,linux系统,运行更稳定
易操作,独特设计的功能管理页面,操作更流畅,更简洁
易扩展,软件层面采用模块化设计并提供达到API接口,方便后期定制;硬件平台标准化,可根据需要处理的数据量大小自由选择、升级配置
相关推荐
数据库静态脱敏产品解决方案.docx
静态数据脱敏系统解决方案的系统架构包括基础组件、配置管理、数据库管理、敏感数据定义、创建数据库、编辑数据库、数据库连接测试、查询数据库等模块。 六、产品功能架构 静态数据脱敏系统解决方案的产品功能架构...
静态数据脱敏系统解决方案 静态数据脱敏系统是一种保护敏感数据的解决方案,旨在防止敏感信息泄露。该系统通过规则进行数据变形,以保护敏感数据的隐私。静态数据脱敏系统适用于非生产环境,包括测试、培训、统计...
静态数据脱敏是其中一种类型,适用于数据库、文件和文档等非动态数据源。Longmai AK-DMS采用多种脱敏方法,如替换、加密、打乱和屏蔽,确保在不影响数据分析的前提下,最大程度地保护个人信息和关键业务数据。 ### ...
- **静态数据脱敏**:针对完整的数据集进行批量脱敏处理,适用于数据备份、测试环境构建等场景。 - **动态数据脱敏**:根据实时需求对数据进行脱敏处理,适用于生产环境中实时数据访问控制等场景。 #### 三、数据...
1. **静态脱敏**:静态脱敏是在数据迁移或复制到数据仓库之前,永久性地修改敏感数据。例如,可以将个人身份证号的最后几位替换为星号,或通过某种算法将真实数值转化为近似值,但保持数据分布特性不变。这种方法...
2. 数据安全防护系统:作为数据库边界的安全守护者,该系统能有效防止非法访问和数据泄露,同时通过静态脱敏、动态脱敏和数据加密技术,确保数据存储和传输的安全。 3. 数据分类分级产品:依据行业标准,对数据资产...
静态脱敏是在数据不被使用时进行,而动态脱敏则在数据实时访问时进行,以提供实时的隐私保护。 5.1.3.大数据敏感数据发现 采用自动化工具和技术,如数据指纹、模式识别和机器学习,来识别和标记敏感数据。 5.1.4....
- 产品分为静态脱敏和动态脱敏,适应不同场景的需求,如开发测试、数据分析、科学研究等。 - 提高数据分发效率,减少敏感数据泄露风险,通过系统自动识别敏感信息和异常处理,避免遗漏和漏脱敏。 - 提升开发测试...
静态数据脱敏是对存储在数据库、文件或其他静态数据源中的敏感信息进行永久性修改,例如,将真实的信用卡号替换为虚构号码。这种脱敏方法适用于数据备份、测试环境和数据分析等场景。动态数据脱敏则是在数据传输或...
静态脱敏是对数据集的一次性处理,适用于离线数据分析;动态脱敏则在数据实时查询或传输时进行,确保每次访问的数据都经过脱敏处理。 5.1.3. 敏感数据发现 通过数据发现工具自动扫描大数据平台中的敏感信息,如...
此外,还有静态和动态数据脱敏技术,前者在数据存储时进行加密,后者在查询数据时进行加密,以提供额外的安全层。 审计功能记录数据库活动,有助于检测异常行为和潜在的攻击。审计日志可以帮助追踪错误,查找安全...
2. 静态脱敏:一次性永久修改敏感数据,适用于离线分析或数据迁移。 3. 可逆脱敏:能够通过特定密钥还原原始数据,适用于需要恢复原始信息的情况。 4. 半结构化和非结构化数据脱敏:针对文本报告、影像资料等复杂...
- 对敏感数据进行加密存储,使用透明数据加密(TDE)等技术来保护静态数据。 - 加密传输过程中的数据,使用SSL/TLS协议来保护数据在传输过程中的安全。 2. **备份与恢复**: - 建立完善的备份计划,定期备份数据库...
- 技术方案:可能包括静态脱敏、动态脱敏、部分脱敏等方法,根据业务需求选择合适的方式。 5.2. 大数据安全系统配置部署 - 部署架构:设计分布式、高可用的系统架构,确保服务的稳定性和性能。 - 硬件设备清单:...
- **静态数据脱敏**:针对存储在数据库中的静态数据进行脱敏处理。 - **动态数据脱敏**:在数据传输过程中实时进行的脱敏处理。 #### 四、数据脱敏原则 **4.1 基本原则**:包括最小化原则、目的相关性原则等,确保...
在实际应用中,这样的导出可能还包括权限控制,比如只导出特定用户的数据库视图,或者对敏感数据进行脱敏处理。同时,为了便于分享和长期保存,导出的网页可以考虑采用静态化技术,生成纯HTML文件,无需服务器端处理...
1. **数据安全**:在公开导出数据库信息时,要确保敏感数据已做脱敏处理,避免泄露隐私或商业秘密。 2. **性能优化**:大量数据的导出和展示可能对服务器造成压力,因此在设计工具时应考虑性能优化,比如分页加载、...