数据脱敏是什么 脱敏数据如何匹配


什么是数据脱敏处理???
数据脱敏处理是指敏感数据发现:按照用户指定或预定义的敏感数据特征 , 对数据库进行识别 , 自动发现敏感数据 。
数据抽取:建立数据子集 , 并根据数据子集的范围抽取数据 。抽取的数据中可进行关联数据的自动识别和数据抽取 。
数据脱敏:对抽取的数据按照用户指定或预定义的脱敏算法策略 , 对数据进行屏蔽、变形、替换、随机等数据脱敏处理 。
数据加载:将脱敏完成后的数据根据用户指定的目标数据库或目标文件进行数据加载 。安华金和数据脱敏产品入选到国有大型银行的供应商 , 国内应该最多2家入围了 。
数据脱敏是什么?【数据脱敏是什么 脱敏数据如何匹配】
数据脱敏是指对某些敏感信息通过脱敏规则进行数据的变形 , 实现敏感隐私数据的可靠保护 。在涉及客户安全数据或者一些商业性敏感数据的情况下 , 在不违反系统规则条件下 , 对真实数据进行改造并提供测试使用 , 如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏 。数据安全技术之一 , 数据库安全技术主要包括:数据库漏扫、数据库加密、数据库防火墙、数据脱敏、数据库安全审计系统 。数据库安全风险包括:拖库、刷库、撞库 。
1、静态脱敏与动态脱敏使用场景和用途的区别
静态脱敏适用于将数据抽取出生产环境脱敏后分发至测试、开发、培训、数据分析等场景 。
原理是将数据抽取进行脱敏处理后 , 下发至脱敏库 。开发、测试、培训、分析人员可以随意取用脱敏数据 , 并进行读写操作 , 脱敏后的数据与生产环境隔离 , 满足业务需要的同时保障生产数据的安全 , 静态脱敏可以概括为数据的“搬移并仿真替换” 。
动态脱敏适用于不脱离生产环境 , 对敏感数据的查询和调用结果进行实时脱敏 。
原理是将生产库返回的数据进行实时脱敏处理 , 例如应用需要呈现部分数据 , 但是又不希望应用账号可以看到全部数据;运维人员需要维护数据 , 但又不希望运维人员可以检索或导出真实数据 , 动态脱敏可以概括为“边脱敏 , 边使用” 。
2、静态脱敏与动态脱敏的技术路线的区别
静态脱敏直接通过屏蔽、变形、替换、随机、格式保留加密(FPE)和强加密算法(如AES)等多种脱敏算法 , 针对不同数据类型进行数据掩码扰乱 , 并可将脱敏后的数据按用户需求 , 装载至不同环境中 。静态脱敏可提供文件至文件 , 文件至数据库 , 数据库至数据库 , 数据库至文件等不同装载方式 。导出的数据是以脱敏后的形式存储于外部存贮介质中 , 实际上已经改变了存储的数据内容 。
动态脱敏通过准确的解析SQL语句匹配脱敏条件 , 例如:访问IP、MAC、数据库用户、客户端工具、操作系统用户、主机名、时间、影响行数等 , 在匹配成功后改写查询SQL或者拦截防护返回脱敏后的数据到应用端 , 从而实现敏感数据的脱敏 。实际上存储于生产库的数据未发生任何变化 。
3、静态脱敏与动态脱敏的部署方式的区别
静态脱敏可将脱敏设备部署于生产环境与测试、开发、共享环境之间 , 通过脱敏服务器实现静态数据抽取、脱敏、装载 。
动态脱敏采用代理部署方式:物理旁路 , 逻辑串联 。应用或者运维人员对数据库的访问必须都经过动态脱敏设备才能根据系统的规则对数据访问结果进行脱敏 。
数据脱敏的处理方法
背景:
需要在非生产环境下对敏感信息进行数据脱敏 , 实现敏感隐私数据的可靠保护 。
脱敏数据特征:
1.保持原有数据特征:例如身份证由17位数字本体码和1位检验码组成 。
2.保持数据之间一致性:出生年月和出生日期之间的关系 。
3.保持业务规则的关联性 。
4.多次脱敏之间的数据一致性 。
脱敏的方法:
1.数据替换
要求:用设置的固定虚构值替换真值 。例如将手机号码统一替换为 13800013800
2.无效化
要求:通过对数据值得截断、加密、隐藏等方式使敏感数据脱敏 , 使其不再具有利用价值 , 例如将地址以 ****** 代替真值 。数据无效化与数据替换所达成的效果基本类似 。
3.随机化
要求:用随机数据代替真值 , 保持替换值的随机性以模拟样本的真实性 。例如用随机生成的姓和名代替真值 。
【注意】这个例子中我们针对数据脱敏引入了外部字典表 , 实际情况中可以根据数据脱敏要求 , 随时引入任意外部字典表 , 通过数据的随机化组合 , 实现替换真值数据的脱敏处理 。
4.偏移和取整
要求:通过随机移位改变数字数据 , 例如日期 2018-01-02 8:12:25 变为 2018-01-02 8:00:00 , 偏移取整在保持了数据的安全性的同时保证了范围的大致真实性 , 此项功能在大数据利用环境中具有重大价值 。
5.掩码屏蔽
要求:掩码屏蔽是针对账户类数据的部分信息进行脱敏时的有力工具 , 比如银行卡号或是身份证号的脱敏 。将身份证号的出生日期进行掩码屏蔽脱敏 。使用left()函数截取身份证号的左边 6 位 + 字符串 ********+right()函数截取身份证号右边 4 位替换源身份证字符串 。
6.灵活编码
要求:在需要特殊脱敏规则时 , 可执行灵活编码以满足各种可能的脱敏规则 。比如用固定字母和固定位数的数字替代合同编号真值 。将合同编号进行自定义编码脱敏 。自定义编码规则:4 位固定码 + 当前年份 + 源目标字符串 4 位号码 +9 位数值组成 。
脱敏相关文章参考:https://www.jianshu.com/p/43d9882ed24a
数据脱敏是什么?
数据脱敏就是对敏感数据进行变形处理 , 其目的是保护隐私数据等信息的安全 , 例如机构和企业收集的个人身份信息、手机号码、银行卡信息等敏感数据 。数据脱敏从技术上可以分为静态数据脱敏和动态数据脱敏两种 。静态数据脱敏一般应用于数据外发场景 , 例如需要将生产数据导出发送给开发人员、测试人员、分析人员等;动态脱敏一般应用于直接连接生产数据的场景 , 例如运维人员在运维的工作中直接连接生产数据库进行运维 , 客服人员通过应用直接调取生产中的个人信息等 。可以找安华金和聊一下 , 他家数据脱敏技术已经很成熟了 。再不明白自己去百度下 。
关于脱敏数据和脱敏数据如何匹配的内容就分享到这儿!更多实用知识经验 , 尽在 www.hubeilong.com