当前位置:首页 > 数据库 >
《Hadoop权威指南》电子书封面

Hadoop权威指南

  • 发布时间:2020年05月21日 12:48:00
  • 作者:Tom White
  • 大小:191.6 MB
  • 类别:Hadoop电子书
  • 格式:PDF
  • 版本:高清第4版
  • 评分:8.7

    Hadoop权威指南 PDF 高清第4版

      给大家带来的一篇关于Hadoop相关的电子书资源,介绍了关于Hadoop、Hadoop指南方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小191.6 MB,Tom White编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.2。

      内容介绍

      Hadoop权威指南(第4版)(修订版&全新升级)融合基础理论和实践活动,循序渐进,多方位详细介绍了Hadoop这一性能卓越的海量信息解决和剖析服务平台。

      本书5一部分24章,第Ⅰ一部分详细介绍Hadoop基本知识,主题风格涉及到Hadoop、MapReduce、Hadoop分布式存储、YARN、Hadoop的I/O实际操作。

      第Ⅱ一部分详细介绍MapReduce,主题风格包含MapReduce应用程序开发;MapReduce的工作方案、MapReduce的种类与文件格式、MapReduce的特点。第Ⅲ一部分详细介绍Hadoop的运维管理,主题风格涉及到搭建Hadoop群集、管理方法Hadoop。第Ⅳ一部分详细介绍Hadoop有关开源网站项目,主题风格涉及到Avro、Parquet、Flume、Sqoop、Pig、Hive、Crunch、Spark、HBase、ZooKeeper。第Ⅴ一部分出示了三个实例,各自来源于医疗服务信息科技服务提供商塞纳(Cerner)、微软公司的人工智能技术新项目ADAM(一种规模性分布式系统深度神经网络架构)和开源网站项目Cascading(一个新的对于MapReduce的数据处理方法API)。
      这书是一本权威、全方位的Hadoop教材和专业书籍,论述了Hadoop生态链的全新发展趋势和运用,程序猿能够 从这当中探寻海量信息集的储存和剖析,管理人员能够 从这当中掌握Hadoop群集的安裝和运维管理。

      目录

      • 第Ⅰ部分 Hadoop基础知识
      • 第1章 初识Hadoop 3
      • 第2章 关于MapReduce 19
      • 第3章 Hadoop分布式文件系统 42
      • 第4章 关于YARN 78
      • 第5章 Hadoop的I/O操作 96
      • 第Ⅱ部分 关于MapReduce
      • 第6章 MapReduce应用开发 141
      • 第7章 MapReduce的工作机制 184
      • 第8章 MapReduce的
      • 第9章 MapReduce的特性 243
      • 第Ⅲ部分 Hadoop的操作
      • 第10章 构建Hadoop集群 279
      • 第11章 管理Hadoop 314
      • 第Ⅳ部分 Hadoop相关开源项目
      • 第12章 关于Avro 341
      • 第13章 关于Parquet 363
      • 第14章 关于Flume 377
      • 第15章 关于Sqoop 398
      • 第16章 关于Pig 420
      • 第17章 关于Hive 469
      • 第18章 关于Crunch 517
      • 第19章 关于Spark 548
      • 第20章 关于HBase 575
      • 第21章 关于ZooKeeper 604
      • 第Ⅴ部分 案例学习
      • 第22章 医疗公司塞纳(Cerner)
      • 第23章 生物数据科学:
      • 第24章 开源项目Cascading 674

      学习笔记

      Hadoop2.8.1完全分布式环境搭建过程

      前言 本文搭建了一个由三节点(master、slave1、slave2)构成的Hadoop完全分布式集群(区别单节点伪分布式集群),并通过Hadoop分布式计算的一个示例测试集群的正确性。 本文集群三个节点基于三台虚拟机进行搭建,节点安装的操作系统为Centos7(yum源),Hadoop版本选取为2.8.0。作者也是初次搭建Hadoop集群,其间遇到了很多问题,故希望通过该博客让读者避免。 实验过程 1、基础集群的搭建 目的:获得一个可以互相通信的三节点集群 下载并安装VMware WorkStation Pro(支持快照,方便对集群进行保存)下载地址,产品激活序列号网上自行查找。 下载CentOS7镜像,下载地址。 使用VMware安装master节点(稍后其他两个……

      Hadoop多Job并行处理的实例详解

      Hadoop多Job并行处理的实例详解 有关Hadoop多Job任务并行处理,经过测试,配置如下: 首先做如下配置: 1、修改mapred-site.xml添加调度器配置: property namemapred.jobtracker.taskScheduler/name valueorg.apache.hadoop.mapred.FairScheduler/value/property 2、添加jar文件地址配置: property namehadoopTest.jar/name value所生成jar的地址/value/property Java基本代码如下: // 获取各个Job,有关Job的创建,这里就不贴上来了。Job job_base = (Job) 。。。;Job job_avg = (Job) 。。。;Job job_runCount = (Job) 。。。;Job job_activeUser = (Job) ....;job_base.setJarByClass(CapuseDateTimerTask.class);job_avg.setJarByClass(CapuseDateTimerTask.class);job_runCount.setJarByClass(CapuseDateTimerTask.class);job_activeUser.setJa……

      Hadoop MultipleOutputs输出到多个文件中的实现方法

      Hadoop MultipleOutputs输出到多个文件中的实现方法 1.输出到多个文件或多个文件夹: 驱动中不需要额外改变,只需要在MapClass或Reduce类中加入如下代码 private MultipleOutputsText,IntWritable mos;public void setup(Context context) throws IOException,InterruptedException { mos = new MultipleOutputs(context);}public void cleanup(Context context) throws IOException,InterruptedException { mos.close();} 然后就可以用mos.write(Key key,Value value,String baseOutputPath)代替context.write(key, value); 在MapClass或Reduce中使用,输出时也会有默认的文件part-m-00*或part-r-00*,不过这些文件是无内容的,大小为0. 而且只有part-m-00*会传给Reduce。 注意:multipleOutputs.write(key, value, baseOutputPath)方法的第三个……

      hadoop的wordcount实例用法分析

      可以通过一个简单的例子来说明MapReduce到底是什么: 我们要统计一个大文件中的各个单词出现的次数。由于文件太大。我们把这个文件切分成如果小文件,然后安排多个人去统计。这个过程就是Map。然后把每个人统计的数字合并起来,这个就是Reduce。 上面的例子如果在MapReduce去做呢,就需要创建一个任务job,由job把文件切分成若干独立的数据块,并分布在不同的机器节点中。然后通过分散在不同节点中的Map任务以完全并行的方式进行处理。MapReduce会对Map的输出地行收集,再将结果输出送给Reduce进行下一步的处理。 对于一个任务的具体执行过程,会有一个名为JobTracker的进程负责协调MapReduce执行过程中……

      Hadoop Combiner使用方法详解

      Hadoop Combiner使用方法详解 Combiner函数是一个可选的中间函数,发生在Map阶段,Mapper执行完成后立即执行。使用Combiner有如下两个优势: Combiner可以用来减少发送到Reducer的数据量,从而提高网络效率。 Combiner可以用于减少发送到Reducer的数据量,这将提高Reduce端的效率,因为每个reduce函数将处理相对较少记录,相比于未使用Combiner之前。 Combiner与Reducer结构相同,因为Combiner和Reducer都对Mapper的输出进行处理。这给了我们一个复用Reducer作为Combiner的好机会。但问题是,复用Reducer作为Combiner总是是一个好主意吗? 特点: Combiners是MapReduce中的一个优化,允许在shuffle和排序阶段之前在本地进行聚合。Combiners的首要……

      以上就是本次介绍的Hadoop电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:概率图模型:原理与技术

      下一篇:HTTP抓包实战

      展开 +

      收起 -

      下载地址:百度网盘下载
      Hadoop相关电子书
      Hadoop基础教程
      Hadoop基础教程 高清版

      Hadoop基础教程 包括三个主要部分:第1~5章讲述了Hadoop的核心机制及Hadoop的工作模式;第6~7章涵盖了Hadoop更多可操作的内容;第8~11章介绍了Hadoop与其他产品和技术的组合使用。《Hadoop基础教程》

      立即下载
      Hadoop&Spark大数据开发实战
      Hadoop&Spark大数据开发实战 高质量版 立即下载
      Hadoop大数据处理
      Hadoop大数据处理 高质量版 立即下载
      Cloudera Hadoop大数据平台实战指南
      Cloudera Hadoop大数据平台实战指南 扫描版

      对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。

      立即下载
      Hadoop YARN权威指南
      Hadoop YARN权威指南 完整版

      《Hadoop YARN权威指南》由YARN的创建和开发团队亲笔撰写,Altiscale的CEO作序鼎力推荐,是使用Hadoop YARN建立分布式、大数据应用的权威指南。书中利用多个实例,详细介绍Hadoop YARN的安装和管理,

      立即下载
      Hadoop深度学习
      Hadoop深度学习 中文扫描版

      本书用Hadoop在深度神经网络中部署大数据 deeplearning 深度学习,处理很多深度学习应用的热点问题并向读者披露解决方案的细节,欢迎下载

      立即下载
      Hadoop生态系统
      Hadoop生态系统 中文超清版

      本书每一章都介绍了不同的主题(例如核心技术或数据传输),并且解释了为什么特定组件适用或不适用特定的需求。对于数据处理来说,使用Hadoop是一个全新的挑战,但如果有了这本便利的参考书,你将很容易领会使用Hadoop的精妙所在

      立即下载
      Hadoop大数据处理技术基础与实践
      Hadoop大数据处理技术基础与实践 超清版 立即下载
      Elasticsearch集成Hadoop最佳实践
      Elasticsearch集成Hadoop最佳实践 中文高清版

      ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。本书全面介绍Elasticsearch Hadoop技术用于大数据分析以及数据可视化的方法,感兴趣的小伙伴们可以参考一下

      立即下载
      深入云计算:Hadoop源代码分析
      深入云计算:Hadoop源代码分析 超清修订版

      Hadoop源代码分析 第2版(修订版) 是一本全面细致介绍和分析Hadoop源码和内部工作机理的技术书籍,通过对Hadoop内部源码详细透彻的解析,使读者能够快速高效地掌握Hadoop的内部工作机制,了解

      立即下载
      读者留言
      Mr.吕航

      Mr.吕航 提供上传

      资源
      39
      粉丝
      12
      喜欢
      101
      评论
      11

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com

      idea注册码