标签分类
当前位置:首页 > > 数据隐私电子书网盘下载
隐私保护数据发布:模型与算法 隐私保护数据发布:模型与算法
码小辫

码小辫 提供上传

资源
44
粉丝
15
喜欢
5
评论
12

    隐私保护数据发布:模型与算法 PDF 高清扫描版

    数据隐私电子书
    • 发布时间:

    给大家带来的一篇关于数据隐私相关的电子书资源,介绍了关于隐私保护算法、模型、算法方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小105.9 MB,吴英杰编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.6

  • 隐私保护数据发布:模型与算法 PDF 下载
  • 下载地址:https://pan.baidu.com/s/18Z6qf4kn4TfV2N98t-U2ug
  • 分享码:avt9
  • 隐私保护数据发布:模型与算法

    隐私保护数据发布:模型与算法 电子书封面

    读者评价

    这本书是我的专业书 ,希望对我专业的成长有所帮助,祝愿码农之家越来越好。尽量把驻当当商家的积极性也提高一下啊
    数据发布中的隐私保护是当前的研究热点,隐私保护数据发布自提出以来,已吸引许多学者展开研究。本书融合了作者近年来致力于该领域研究的科研成果。

    内容介绍

    隐私保护数据发布:模型与算法主要阐述数据共享发布中的两大主要隐私保护模型及其关键算法。

    全书分为两篇,第一篇阐述匿名隐私保护数据发布,由第1~9章组成,主要内容涉及匿名隐私保护相关知识、k-匿匿名组规模的上界讨论、关系型数据发布及其扩展背景(数据增量更新和多敏感属性数据发布)下的匿名隐私保护、非关系型数据(包括事务型数据、社会网络数据和轨迹数据)发布中的匿名隐私保护模型及算法、面向LBS应用的位置隐私保护等;第二篇阐述差分隐私保护数据发布,由第10~19章组成,主要内容涉及差分隐私基础知识、基于k叉平均树的差分隐私数据发布、面向任意区间树结构及其扩展背景(考虑区间查询分布和异方差加噪)下的差分隐私直方图发布、面向其他应用背景(流/连续数据发布、稀疏/多维数据发布)的差分隐私保护、差分隐私下的频繁模式挖掘等。

    本书主要面向计算机科学、网络空间安全、管理科学与工程等相关学科专业高年级本科生、研究生以及广大研究数据安全隐私保护的科技工作者。

    内容节选

    1.1、什么是K近邻算法
    何谓K近邻算法,即K-Nearest Neighbor algorithm,简称KNN算法,单从名字来猜想,可以简单粗暴的认为是:K个最近的邻居,当K=1时,算法便成了最近邻算法,即寻找最近的那个邻居。为何要找邻居?打个比方来说,假设你来到一个陌生的村庄,现在你要找到与你有着相似特征的人群融入他们,所谓入伙。
    用官方的话来说,所谓K近邻算法,即是给定一个训练数据集,对新的输入实例,在训练数据集中找到与该实例最邻近的K个实例(也就是上面所说的K个邻居),这K个实例的多数属于某个类,就把该输入实例分类到这个类中。根据这个说法,咱们来看下引自维基百科上的一幅图:
    如上图所示,有两类不同的样本数据,分别用蓝色的小正方形和红色的小三角形表示,而图正中间的那个绿色的圆所标示的数据则是待分类的数据。也就是说,现在,我们不知道中间那个绿色的数据是从属于哪一类(蓝色小正方形or红色小三角形),下面,我们就要解决这个问题:给这个绿色的圆分类。
    我们常说,物以类聚,人以群分,判别一个人是一个什么样品质特征的人,常常可以从他/她身边的朋友入手,所谓观其友,而识其人。我们不是要判别上图中那个绿色的圆是属于哪一类数据么,好说,从它的邻居下手。但一次性看多少个邻居呢?从上图中,你还能看到:
    如果K=3,绿色圆点的最近的3个邻居是2个红色小三角形和1个蓝色小正方形,少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于红色的三角形一类。
    如果K=5,绿色圆点的最近的5个邻居是2个红色三角形和3个蓝色的正方形,还是少数从属于多数,基于统计的方法,判定绿色的这个待分类点属于蓝色的正方形一类。
    于此我们看到,当无法判定当前待分类点是从属于已知分类中的哪一类时,我们可以依据统计学的理论看它所处的位置特征,衡量它周围邻居的权重,而把它归为(或分配)到权重更大的那一类。这就是K近邻算法的核心思想。
    1.2、近邻的距离度量表示法
    上文第一节,我们看到,K近邻算法的核心在于找到实例点的邻居,这个时候,问题就接踵而至了,如何找到邻居,邻居的判定标准是什么,用什么来度量。这一系列问题便是下面要讲的距离度量表示法。但有的读者可能就有疑问了,我是要找邻居,找相似性,怎么又跟距离扯上关系了?
    这是因为特征空间中两个实例点的距离和反应出两个实例点之间的相似性程度。K近邻模型的特征空间一般是n维实数向量空间,使用的距离可以使欧式距离,也是可以是其它距离,既然扯到了距离,下面就来具体阐述下都有哪些距离度量的表示法,权当扩展。
    1.欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,…,xn) 和 y = (y1,…,yn) 之间的距离为:
    (1)二维平面上两点a(x1,y1)与b(x2,y2)间的欧氏距离:
    (2)三维空间两点a(x1,y1,z1)与b(x2,y2,z2)间的欧氏距离:
    (3)两个n维向量a(x11,x12,…,x1n)与 b(x21,x22,…,x2n)间的欧氏距离:
    也可以用表示成向量运算的形式:
    其上,二维平面上两点欧式距离,代码可以如下编写:

    //unixfy:计算欧氏距离  
    double euclideanDistance(const vector<double>& v1, const vector<double>& v2)  
    {  
         assert(v1.size() == v2.size());  
         double ret = 0.0;  
         for (vector<double>::size_type i = 0; i != v1.size(); ++i)  
         {  
             ret += (v1[i] - v2[i]) * (v1[i] - v2[i]);  
         }  
         return sqrt(ret);  
     }

    目录

    • 第一篇 基于匿名模型的隐私保护数据发布
    • 第1章 绪论
    • 第2章 k-匿名组规模的上界讨论
    • 第3章 基于空间划分的隐私保护关系型数据发布算法
    • 第4章 隐私保护增量数据重发布
    • 第5章 面向多敏感属性的隐私保护数据发布
    • 第6章 隐私保护事务型数据发布
    • 第7章 隐私保护社会网络数据发布
    • 第8章 隐私保护轨迹数据发布
    • 第9章 面向LBS应用的位置隐私保护
    • 第二篇 基于差分隐私的隐私保护数据发布
    • 第10章 基于差分隐私的统计数据发布概述
    • 第11章 基于k叉平均树的差分隐私数据发布
    • 第12章 面向任意区间树结构的差分隐私直方图发布
    • 第13章 基于树重构的差分隐私直方图发布
    • 第14章 异方差加噪下的差分隐私直方图发布
    • 第15章 差分隐私连续数据发布
    • 第16章 面向二维数据流的差分隐私统计发布
    • 第17章 差分隐私二维空间数据划分发布
    • 第18章 面向低频统计值的差分隐私数据发布
    • 第19章 差分隐私下的频繁模式挖掘

    上一篇:汪博士解读PMP考试  下一篇:循序渐进学Spark

    展开 +

    收起 -

    数据隐私相关电子书
    学习笔记
    网友NO.35041
    网友NO.35041

    知识在于积累,学习需要耐力。学习就像挖金矿,或许一开始毫无头绪,一头雾水,但转个角度,换换工具,时间久了总会找到一个缝隙。成功就是你比别人多走了一段路,或许恰恰是那么一小步。
    第一个建议:多角度,对比学习
    学习算法,可以先阅读一本简单的入门书,然后综合几本书横向多角度看,例如学习动态规划,拿几本算法书,把动态规划这章找出来,比较学习,多角度对比分析更清晰,或许你会恍然大悟,噢,原来如此简单。或许有同学说我哪有那么多钱买那么多书,只要你想学习,没有什么可以阻挡!你可以联系你的老师,每学期上课前,我都会告诉学生,如果你想学习却没钱买书,我可以提供帮助。想一想,你真的没有办法?
    第二个建议:大视野,不求甚解
    经常有学生为了一个公式推导,或几句代码抛锚,甚至停滞数日,然后淹没在无尽的挫败感中,把自己弄得垂头丧气。公式可以不懂,代码可以不会。你不必投入大量精力试图推导书上的每一个公式,也不必探究语法或技术细节。学算法就是学算法本身,首先是算法思想,解题思路,然后是算法实现,算法思想的背后可能有高深的数学模型,复杂的公式推导,你理解了当然玄妙,不懂就拉倒。算法实现可以用任何语言,所以不必纠结是C,C++,Java,Python,更不必管严格的语法规则,除非你要上机调试。建议还是先领会算法,写伪代码,在大脑中调试吧,如果没有良好的编程经验,一开始就上机或许更让你崩溃。遇到不懂的部分,浏览一下或跳过去,读完了还不明白再翻翻别的书,总有一天,你会发现,“暮然回首,那人却在灯火阑珊处”。
    第三个建议:多交流,见贤思齐
    与同学,朋友,教师或其他编程爱好者们一起学习和讨论问题,是取得进步最有效的办法,也是分享知识和快乐的途径。加入论坛,加入交流群,会了解其它人在做什么,怎么做,遇到问题可以请教高手,带来醍醐灌顶的喜悦;也可以应助菜鸟,使你暗自得意,信心倍增。论坛和群也会分享大量的学习资料和视频,还有不定期的培训讲座,读书交流会,你会发现,不是你一个人在战斗!
    第四个建议:勤实战,越挫越勇
    实践是检验一切真理的标准。古人云:“学以致用”,“师夷长技以制夷”。请不要急切期盼“实际的”例子,更不要看不起小实例,“不积跬步,无以至千里”。大规模的成功商业案例所采用的算法,人工情感,无人驾驶,不是我们目前要解决的问题。看清楚脚下的路,比仰望天空更实际,多做一些实战练习,更好地体会算法的本质,在错误中不断成长,越挫越勇,终究会成参天大树。
    第五个建议:看电影,洞察未来
    不管是讲《人工智能》,还是《算法分析》,我都会建议同学们去看一看科幻电影,如《人工智能》、《记忆裂痕》、《绝密飞行》、《未来战士》、《她》等等。奇妙的是,这些科幻的东西,正在一步步的实现,靠的是什么?人工智能。计算机的终极是人工智能,人工智能的核心是算法。未来的战争是科技的战争,先进的科技需要人工智能。我们的国家还有很多技术落后,未来需要你。
    “一心两本”学习法:一颗好奇心,两个记录本。
    怀着一颗好奇心去学习,才能不断的解决问题,获得满足感,体会算法的美。很多科学大牛的秘诀就是永远保持一颗好奇心;一个记录本用来记录学习重点难点,随时的突发奇想;一个记录本做日记或周记,记录一天或一周来学了什么,有什么经验教训,需要注意什么,计划下一天或下一周做什么。不停的总结反思过去,计划未来,这样每天都有事做,心中满满的能量。一个人经常上课睡觉,因为他心中无事可做;一个人经常失眠,因为他心里事儿太多!
    没有人能一蹴而就,付出总有回报。或许拼死了努力,你的女神都不会正眼看你,但知识这个美女,她没有任何偏见,她只喜欢——“你懂得”。或许你早已对我的喋喋不休、东拉西扯倍感厌烦,咳咳,打住,Let’s go!

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明