当前位置:主页 > 计算机电子书 > 大数据分析 > 大数据 pdf电子书
实战大数据

实战大数据 PDF 全书完整版

  • 更新:2021-03-05
  • 大小:113.03MB
  • 类别:大数据
  • 作者:鲍亮
  • 出版:清华大学出版社
  • 格式:PDF

  • 资源介绍
  • 学习心得
  • 相关内容

实战大数据》是由清华大学出版社出版的一本关于大数据方面的书籍,作者是鲍亮,主要介绍了关于实战大数据、大数据方面的知识内容,目前在大数据类书籍综合评分为:9.2分。

书籍介绍

实战大数据

作者:鲍亮,李倩 编著

“数据是重要资产”已成为大家的共识,众多公司都在争相分析、挖掘大数据背后的信息资源。《实战大数据》在此背景下,对目前大数据及其相关技术的发展进行总结,理论联系实践,既不缺乏理论深度又具有实用价值。《实战大数据》共12章,内容包括大数据的概念、特点、发展历史,数据获取与存储,数据抽取和清洗,数据集成,数据的查询、分析与建模,异构数据采集,文档的存储与检索,异种数据的统一访问与转换,基于微博的股票市场预测系统实例,海量视频检索系统实例,HDFS云文件系统实例。《实战大数据》适合大数据技术初学者、大数据从业人员和研究人员,也可以作为高等院校相关专业师生的教学参考书。

目录

  • 第一篇 大数据基础篇
  • 第1章 大数据介绍
  • 1.1 大数据相关概念
  • 1.1.1 大数据的历史
  • 1.1.2 大数据的定义
  • 1.2 大数据研究内容
  • 1.3 人数据研究现状
  • 1.3.1 学术界现状
  • 1.3.2 产业界现状
  • 1.3.3 政府机构现状
  • 1.4 大数据的应用领域
  • 1.4.1 大数据在制造业的应用
  • 1.4.2 大数据在服务业的应用
  • 1.4.3 大数据在交通行业的应用
  • 1.4.4 大数据在医疗行业的应用
  • 1.5 本章小结
  • 第2章 数据存储技术
  • 2.1 数据存储技术介绍
  • 2.2 数据采集与存储技术研究现状
  • 2.2.1 传统关系型数据库
  • 2.2.2 新兴数据存储系统
  • 2.3 海量数据存储的关键技术分析
  • 2.3.1 数据划分
  • 2.3.2 数据一致性与可用性
  • 2.3.3 负载均衡
  • 2.3.4 容错机制
  • 2.3.5 海量数据存储的硬件支持
  • 2.4 数据存储技术的实现与工具
  • 2.4.1 集中式数据存储管理系统Bigtable
  • 2.4.2 非集中式的大规模数据管理系统Dynamo
  • 2.4.3 BigTable的开源实现HBase
  • 2.4.4 MongoDB
  • 2.4.5 CouchDB
  • 2.4.6 Redis
  • 2.4.7 Hypertabie
  • 2.4.8 其他开源NoSQL数据库
  • 2.5 本章小结
  • 第3章 数据抽取和清洗
  • 3.1 数据抽取和清洗技术介绍
  • 3.1.1 数据抽取简介
  • 3.1.2 数据清洗简介
  • 3.2 数据抽取和清洗研究现状
  • 3.3 数据抽取技术的实现
  • 3.3.1 Web数据抽取
  • 3.3.2 非结构化数据抽取
  • 3.3.3 基于云计算的海量数据分析
  • 3.4 数据清洗技术的实现
  • 3.4.1 数据清洗流程
  • 3.4.2 数据清洗框架
  • 3.4.3 数据清洗相关技术
  • 3.4.4 基天Hadoop的数据清洗方案
  • ……
  • 第二篇 大数据深入篇
  • 第三篇 大数据应用篇
     

资源获取

资源地址1:https://pan.baidu.com/s/1xYiJri2DI5TPh9FP1Ghmbg(密码:vw3a)

相关资源

网友留言