首页 > 热点资讯 >新闻内容

数据脱敏——什么是数据脱敏

2021年06月02日 12:06

一、什么是数据脱敏


数据脱敏(Data Masking),又称数据漂白、数据去隐私化或数据变形。

百度百科对数据脱敏的定义为:指对某些敏感信息通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。在涉及客户安全数据或者一些商业性敏感数据的情况下,在不违反系统规则条件下,对真实数据进行改造并提供测试使用,如身份证号、手机号、卡号、客户号等个人信息都需要进行数据脱敏。

生活中不乏数据脱敏的例子,比如我们最常见的火车票、电商收货人地址都会对敏感信息做处理,甚至女同志较熟悉的美颜、有些视频中的马赛克都属于脱敏。


二、为什么要进行数据脱敏


上面说到,在“涉及客户安全数据或者一些商业性敏感数据的情况下”对数据进行改造,说明我们要进行改造的数据是涉及到用户或者企业数据的安全,进行数据脱敏其实就是对这些数据进行加密,防止泄露。

对于脱敏的程度,一般来说只要处理到无法推断原有的信息,不会造成信息泄露即可,如果修改过多,容易导致丢失数据原有特性。因此,在实际操作中,需要根据实际场景来选择适当的脱敏规则。改姓名,身份证号,地址,手机号,电话号码等几个客户相关字段。

三、如何实现数据脱敏


按照脱敏规则,可以分为可恢复性脱敏和不可恢复性脱敏。可恢复性脱敏就是数据经过脱敏规则的转化后,还再次可以经过某些处理还原出原来的数据,相反,数据经过不可恢复性脱敏之后,将无法还原到原来的样子,可以把二者分别看做可逆加密和不可逆加密。

我们目前遇到的场景是日志脱敏,即在把日志中的密码,甚至姓名、身份证号等信息都进行脱敏处理。

脱敏前:


脱敏后:

如上图,仔细分析会发现,打日志之前,获得脱敏的数据就两个步骤:【拿到要输入的数据(user实体)】→【进行序列化】,所以要进行数据脱敏可以考虑在这两个步骤上进行实现。第一个方法就是在序列化实体之前先把需要脱敏的字段进行处理,之后正常序列化;第二个方法就是在实体序列化的时候,对要脱敏的字段进行处理。


相关推荐

联盟功能更新,站长内测效果显著

由租客网赞助开发的这个资讯和网址收录类网站管理系统,经过更新并对服务器更新后上线,功能明显增加,关键词收录和网站排名明显提升,同时做到MIP自适应,系统自动对百度进行推送,实现百度实时收录。目前已经成功上线近500个主站,开通城市站点近1万个,服务器性能稳定,系统相对稳定。该系统在不断更新进化,真正实现零技术建站,零成本维护自己的站点(服务器费用由租客网赞助,名额有限)。希望能与站长们共同成长,见证奇迹。

2020年04月19日 12:42

百度去域名化这步棋真走错了,逆趋势啊

在刚刚发布的百度2019年第四季度及全年财报中,百度该季度营收289亿,净利润达92亿,同比增长95%,双双超过华尔街预期。全年营收1074亿元,连续三个季度营收超过华尔街预期。虽然表面上是一片欣欣向荣的景象,但依然止不住百度摇摇欲坠的趋势。从以前并驾齐驱的BAT三巨头,发展到如今,百度的价值却不如腾讯和阿里市值的零头,巨幅缩水。其地位甚至被后起之秀们,美团,京东,拼多多超越,这混得也太惨了吧。百度的缓慢衰落,与其屡次三番的“骚操作”不无关系,其中之一就是熊掌号。熊掌号是百度搜索生态打造的重量级产品,旨在赋能B端生态合作伙伴,让搜索用户获得更可靠的信息和服务,于2017年11月16日发布。传统生态下,用户常常处于在不同站点间“用完即走”的状态,这使得站长们严重依赖于流量收入,而百度表示从站到号是搜索新生态的重要特征,熊掌号就是“站”的后继者,是移动时代的“新域名”。原本,小编以为熊掌号是百度为了对抗微信公众号、阿里店铺等做出的内容号,是一个委以重任的大项目。可谁知道,熊掌号于2018年11月底,不宣而停。目前登录熊掌号,首页已没有熊掌号的宣传图片,唯有小程序平台和百家号平台链接。百度也没有明确公告,是内哄?是转战小程序?总之拿站长们当猴耍,视如草芥....原来,百度还是只能玩搜索,毕竟玩啥都觉得是搜索。其实百度前些年大力推广熊掌号的意图很明显,那就是弱化域名。百度是需要弱化域名的,因为百度是一个搜索引擎,如果网民都依靠域名直达网站,谁还会去用百度呢?而且,目前百度也遇到了一些麻烦。头条,阿里和腾讯都不向百度开放搜索接口,百度的咨询从哪里来呢?要靠百度自己的生态圈和众多小站长提供资源,熊掌号也是百度解决这些麻烦的一次尝试。因此,百度搜索弱化域名,是从其自身生存角度出发的。唯有去域名,百度才会有更多的生意。这些年在移动联网的大潮中,腾讯有微信,阿里有支付宝,二者几乎平分了用户在移动端的入口,等后知后觉的百度意识到问题的严重性时,已经晚了,那个曾经PC端的流量霸主不得不向移动互联网时代低头,这两年推出了百度APP似乎也难挽回局面了。去域名化看似是百度在进行自救,实则是一种无奈而又自私的行为。一个网站的名称、版式、内容……这些东西都有可能“被山寨”,但是网址(域名)却是造不了假;如果在搜索结果中把域名隐藏起来,无异于助纣为虐。单从关键词来看,用户无法从搜索结果中分辨网站的真伪,那些钓鱼网站只要付费推广,更加容易误导普通用户。正牌官网如果想要让用户容易识别,只能通过向百度付费从而在搜索结果上获得相应标识,这一招无异于饮鸩止渴。尽管如此,百度CEO李彦宏曾经在个人社交软件微信朋友圈发文表示,如果谷歌决定回到中国,百度非常有信心与其“对决”。谷歌市值9205.03亿美元,世界前500强网站中占有数十个席位,百度拿什么赢得这场对决,小编不知道李总哪来的自信。同样是做搜索引擎,谷歌就深知重视域名才是时代潮流。在几年前,谷歌搜索就调整了算法,看重域名和关键词的匹配度。现在使用谷歌搜索,在搜索结果中,域名也处于突出的位置。由于域名本身不可替代,在搜索结果中呈现出域名,本身也体现了一种严谨性和公平性。不仅是企业,现在个人也很重视域名。美国很多房产经纪人,自己都有域名,自己在谷歌上面推广自己的网站,网店。今日头条也是借助个体的力量才得以推广做大。只有重视了个体的入口,自己才能做真正的平台入口。百度弱化域名这步棋,真是走错了

2020年03月12日 17:43

房屋租赁发票税点是多少?房屋租赁发票如何开?

一、房屋租赁的税率用于经营的缴12%房产税,租金超过5000元的,还需要缴纳营业税5%,附加税费在0.6%左右(各地规定不一)。最低税负为17.5%。如果是个人出租的,那还要带征个人所得税(各地规定不一,一般在3%以下),这样可能还是高一些。二、核定租金收入的方法和程序1、申报登记。凡是本辖区范围内的居民自建房屋,无论出租与否,一律如实登记,纳入管理的范围。2、核定出租率。每年初,由租赁管理所和税务所组织成立联合审定小组,在分片选点的基础上,对各片区房屋出租情况进行典型调查,审核确定出租比率,并以报表形式报区租赁管理办和区地税局备案。3、核实出租面积。由代征人员实地察看自建房总层数、业主自用层数和每层平均建筑面积及商铺面积,登记《私人出租屋税费核定审批表》,由租赁管理站初审核实各栋楼可出租房屋总建筑面积后,上报租赁管理所审定。4、确定租赁面积、计算租金收入。租赁管理所收集整理管理站上报的《私人出租屋税费核定审批表》,计算填写租金收入等相关内容。核定租金的有关情况以报表形式报区租赁管理办和税务所备案。税务所若有异议,应及时进行调查核实,并将修改意见回复租赁管理所,由租赁管理所重新核定租金收入。5、文书送达。租赁管理所根据审核通过的《私人出租屋税费核定审批表》,制作《私人房屋租赁缴纳税费登记卡》发还管理站,由管理员送达业主。业主按《私人房屋租赁缴纳税费登记卡》的内容到所属管理站(所)缴纳税费。6、租金调整。业主如对核定的租金收入有异议,可在收到《私人房屋租赁缴纳税费登记卡》的5日内,向租赁管理所提出复核书面申请。租赁管理所应及时给予答复。对不予调整的进行解释说明;对需要调整的及时组织复核、重新核定,并收回原送达的《私人房屋租赁缴纳税费登记卡》作废。7、检查复核。每年由区地方税务局和区房屋租赁管理办公室抽调人员组成联合检查复核小组,采取不定期方式,对年内各租赁管理所核定租金情况进行检查复核,检查结果在两个系统内进行通报。8、申报停租或变更。对已实行“核定租金”方式管理的出租屋,原则上不再受理停租或变更。特殊情况下需要申报停租或变更的,业主必须提出书面申请,报管理站、租赁管理所、区租赁管理办逐级调查核实后,以报表形式向税务机关备案。房屋租赁发票怎么开?据市地税部门的工作人员介绍,只要符合“房租超过家庭月工资收入15%”这个条件,已缴纳住房公积金的职工就可以申请提取公积金支付房租。房东或者房客任何一方到房屋所属区域的地税部门即可开具发票。办理时须携带房产证原件及复印件、房东身份证复印件和租房合同原件、复印件。开具发票时需要缴纳的税费包括:对个人出租住房所得减按10%的税率征收个人所得税。对个人出租、承租住房签订的租赁合同,免征印花税。对个人出租住房,不区分用途,在3%税率的基础上减半征收营业税,按4%的税率征收房产税,免征城镇土地使用税。此外,对企事业单位、社会团体以及其他组织按市场价格向个人出租用于居住的住房,按4%的税率征收房产税。

2020年04月16日 01:25