当前位置:主页 > 计算机电子书 > 数据库 > 大数据下载
大数据治理

大数据治理 PDF 高质量版

  • 更新:2019-09-17
  • 大小:40.5 MB
  • 类别:大数据
  • 作者:Sunil、Soares
  • 出版:清华大学出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

大数据治理

大数据将开启各个领域的数据“潘多拉魔盒”。社交平台、电子商务大佬、通信运营商甚至金融业、诊疗、文化教育等制造行业,都将添加大数据的“挖金”风潮,行政部门一样是从大数据中受益良多。如何把海量信息运用于管理决策、营销推广和创新产品?怎样运用数据管理平台提升商品、步骤和服务项目?怎样运用大数据更科学研究地制订公共政策、保持社会管理创新?全部这任何,都不可或缺大数据治理。可以说,在大数据发展战略从统筹规划到最底层保持的“落地式”全过程中,整治是基本,技术性是承重,剖析是方式,运用是目地。桑尼尔·索雷斯的《大数据治理》的汉语翻译出版发行,正当性其时。

《大数据治理》一书不错地考虑了了解大数据治理架构的必须,系统化论述了大数据治理的每个版面,剖析了几大类大数据的整治,调查了大数据治理在典型性制造行业的实践活动,并从入门到精通地详细介绍了现如今流行的云计算技术与服务平台。此书具备必须的可参照性、可执行性和易读性,是大数据治理行业最该一读的教材。

从“步骤”关键变化为“数据”关键

大数据时代,测算方式也产生了变化,从“步骤”关键变化为“数据”关键。hadoop管理体系的分布式计算架构早已是“数据”为关键的统一范式。关系型数据库及剖析要求,将更改it互联网系统软件的升級方法:从简易增减到构架转变。大数据下的新思路——测算方式的变化。
比如:IBM将应用以数据为管理中心的设计方案,目地是减少在高性能计算机中间开展很多数据传输的重要性。大数据下,云计算技术找到破茧重生的机遇,在储存和测算上面最能体现数据为关键的核心理念。大数据和云计算技术的关联:云计算技术为大数据出示了强有力的专用工具和方式,大数据为云计算技术出示了很有使用价值的立足之地。而大数据比云计算技术更加落地式,可合理运用已很多基本建设的云计算资源,最终多方面运用。

科学研究发展很多地由数据来促进,海量信息给数据统计分析既产生了机会,也组成了新的挑戰。大数据因此是运用诸多技术性和方式,综合性源于好几个方式、不一样時间的信息内容而得到的。以便解决大数据产生的挑戰,人们必须新的统计分析构思和计算方式。

表明:用数据关键思维模式独立思考,解决困难。以数据为关键,体现了时下it互联网产业链的转型,数据变成人工智能技术的基本,也变成智能化系统的基本,数据比步骤更关键,数据库查询、纪录数据库查询,都可以开发设计出多方面信息内容。云计算机可以从数据库查询、纪录数据库查询中检索出我是谁,你必须哪些,进而强烈推荐让你必须的信息内容。

目录

  • 第一部分 开篇
  • 第1章 大数据治理概述
  • 第2章 大数据治理的框架
  • 2.1 大数据类型
  • 2.2 信息治理准则
  • 2.3 大数据治理的产业和功能场景
  • 第3章 成熟度评估
  • 3.1 IBM信息治理委员会的成熟度模型
  • 3.2 评估成熟度的示例问题
  • 第4章 业务案例
  • 4.1 通过大数据治理,提高运营实时性和旅客安全度
  • 4.2 量化大数据治理对客户隐私的财务影响
  • 4.3 通过治理大数据生命周期,降低IT成本
  • 4.4 评估数据质量和主数据对大数据计划的影响
  • 4.5 计算大数据质量的价值
  • 第5章 路线图
  • 5.1 路线图案例研究
  • 第二部分 大数据治理准则
  • 第6章 大数据治理的组织
  • 6.1 绘制关键流程图并建立职责分配模型,以识别大数据治理中的利益攸关者
  • 6.2 确定新角色和既有角色的适当组合
  • 6.3 酌情任命大数据主管
  • 6.4 在传统信息治理角色的基础上,酌情增加大数据责任
  • 6.5 建立承担包括大数据在内的责任混合式信息治理组织
  • 第7章 元数据
  • 7.1 创建一个体现关键大数据术语的业务定义的词库
  • 7.2 理解对ApacheHadoop中元数据的持续支持
  • 7.3 对业务词库中的敏感大数据进行标记
  • 7.4 从相关的大数据存储中输入技术元数据
  • 7.5 将相关的数据源与业务词库中的术语进行链接
  • 7.6 使用运营元数据监测大数据的流动
  • 7.7 保留技术元数据,以支持数据血统和影响分析
  • 7.8 从非结构化文件中采集元数据,支持企业搜索
  • 7.9 扩展既有的元数据角色,将大数据纳入其中
  • 第8章 大数据隐私
  • 8.1 识别敏感的大数据
  • 8.2 对元数据库中的敏感大数据进行标记
  • 8.3 应对国家、州(省)层面的隐私立法和隐私限制
  • 8.4 管理个人数据跨国界流动的情况
  • 8.5 监控特权用户对敏感大数据的访问
  • 第9章 大数据质量
  • 9.1 与商业上的利益攸关者协作,建立并测度大数据质量的置信区间
  • 9.2 利用准结构化和非结构化数据,提高人口稀疏的结构化数据的质量
  • 9.3 使用流数据分析技术解决内存中的数据质量问题,无须将中间结果输入硬盘
  • 9.4 任命对信息治理委员会负责的数据主管,由其负责提高测度的质量
  • 第10章 业务流程整合
  • 10.1 识别将会受到大数据治理影响的关键流程
  • 10.2 建立关键活动的流程图
  • 10.3 针对业务流程中的关键步骤,制定大数据治理政策
  • 第11章 主数据整合
  • 11.1 提高主数据的质量,以支持大数据分析
  • 11.2 利用大数据提高主数据的质量
  • 11.3 提高关键参考数据的质量和一致性,以支持大数据治理计划
  • 11.4 审视社交媒体平台政策,以确定与主数据管理整合的程度
  • 11.5 从非结构化文本中挖掘有用信息,以丰富主数据
  • 第12章 管理大数据的生命周期
  • 12.1 基于规制和业务要求,扩展保留时间表,将大数据包含其中
  • 12.2 提供法律保留区,并支持电子证据展示(eDiscovery)
  • 12.3 压缩大数据并将其存档,降低IT成本,提高应用绩效
  • 12.4 管理实时流数据的生命周期
  • 12.5 保留社交媒体记录,以符合规制要求,并支持电子证据展示
  • 12.6 基于规制和业务要求,正当合理地处置不再需要的大数据
  • 第三部分 大数据的类型
  • 第13章 Web和社交媒体数据
  • 13.1 在制定有关客户社交媒体数据的可接受使用的政策时,考虑不断变化的规制和习俗
  • 13.2 制定有关雇员和求职者社交媒体数据的可接受使用的政策
  • 13.3 利用置信区间评估社交媒体数据的质量
  • 13.4 制定有关Cookies与其他Web跟踪装置的可接受使用的政策
  • 13.5 在不侵犯隐私并遵从规制要求的基础上,定义连接在线和离线数据的政策
  • 13.6 确保网络统计数据的一致性
  • 第14章 机器对机器的数据
  • 14.1 评估目前可用的地理位置数据
  • 14.2 制定关于客户地理位置数据的可接受使用的政策
  • 14.3 制定关于雇员地理位置数据的可接受使用的政策
  • 14.4 保证RFID数据的隐私安全
  • 14.5 制定与其他类型M2M数据的隐私相关的政策
  • 14.6 处理元数据和M2M数据的质量问题
  • 14.7 制定与M2M数据的保留期有关的政策
  • 14.8 提高主数据的质量,以支持M2M计划
  • 14.9 确保SCADA设施免遭网络攻击
  • 第15章 大体量交易数据
  • 第16章 生物计量学数据
  • 16.1 评估与生物计量学数据的可接受使用相关的隐私含义
  • 16.2 与法律顾问通力合作,确定演进中的规制对使用客户和雇员生物计量学数据的影响
  • 第17章 人工生成的数据
  • 17.1 制定屏蔽敏感的人工生成数据的政策
  • 17.2 使用非结构化的人工生成数据,提高结构化数据的质量
  • 17.3 管理人工生成数据的生命周期,降低成本并遵循规制要求
  • 17.4 从非结构化的人工生成数据中获得洞察力,以丰富MDM
  • 第四部分 行业视角
  • 第18章 医疗保健机构
  • 18.1 利用非结构化数据,提高人口稀疏的结构化数据的质量
  • 18.2 提取从结构化数据中无法获得的更多临床因素
  • 18.3 设定关键业务术语的一致性定义
  • 18.4 确保跨科室的患者主数据的一致性
  • 18.5 与美国HIPAA的规定一致,符合受保护的健康信息的隐私要求
  • 18.6 创造性管理参考数据,以获得更多临床洞察
  • 第19章 公用事业部门
  • 19.1 复制仪表读数
  • 19.2 主关键字的参照完整性
  • 19.3 异常的仪表读数
  • 19.4 客户地址的数据质量
  • 19.5 信息生命周期管理
  • 19.6 数据库监测
  • 19.7 技术架构
  • 第20章 通信服务提供商
  • 20.1 大数据类型
  • 20.2 将大数据与主数据进行整合
  • 20.3 大数据隐私
  • 20.4 大数据质量
  • 20.5 大数据生命周期管理
  • 第五部分 大数据技术
  • 第21章 大数据的参考架构
  • 21.1 大数据源
  • 21.2 开源基础组件
  • 21.3 Hadoop发行版
  • 21.4 流数据分析
  • 21.5 数据库
  • 21.6 大数据整合
  • 21.7 文本分析
  • 21.8 大数据发现
  • 21.9 大数据质量
  • 21.10 大数据的元数据
  • 21.11 信息政策管理
  • 21.12 主数据管理
  • 21.13 数据仓库与数据集市
  • 21.14 大数据分析与报告
  • 21.15 大数据安全与隐私
  • 21.16 大数据生命周期管理
  • 21.17 云
  • 第22章 大数据平台
  • 22.1 IBM
  • 22.2 甲骨文
  • 22.3 SAP
  • 22.4 微软
  • 22.5 HP
  • 22.6 Informatica
  • 22.7 SAS
  • 22.8 Teradata
  • 22.9 EMC
  • 22.10 Amazon
  • 22.11 谷歌
  • 22.12 Pentaho
  • 22.13 Talend
  • 附录 缩略语列表
  • 译者后记

资源下载

资源下载地址1:https://pan.baidu.com/s/1hsa7q0AA1yQwtIy3WPVjKg

相关资源

网友留言