Hadoop 电子书籍推荐

本专题中精选Hadoop相关编程电子书籍推荐、电子文档资源及配套资源等内容,更多相关内容陆续增加,建议收藏本栏目,由网友蒯新月整理汇总,本站整理包含Hadoop的内容共计24个,剩余218个等待更新。

“Hadoop”书籍列表

  • 《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》源代码

    《Hadoop技术内幕:深入解析Hadoop Common和HDFS架构设计与实现原理》源代码

    Hadoop技术内幕共两册,分别从源代码的角度对Common+HDFS和MapReduce的架构设计和实现原理进行了极为详细的分析。本书由腾讯数据平台的资深Hadoop专家、X-RIME的作者亲自执笔,对Common和HDFS的源代码进行了分析,旨在为Hadoop的优化、定制和扩展提供原理性的指导。除此之外,本书还从源代码实现中对分布式技术的精髓、分布式系统设计的优秀思想和方法,以及Java语言的编码技巧、编程规范和对设计模式的精妙运用进行了总结和分析,对提高读者的分布式技术

    时间:2022-05-10

    详细内容
  • 《Hadoop海量数据处理:技术详解与项目实战》代码

    《Hadoop海量数据处理:技术详解与项目实战》代码

    编辑推荐 Hadoop是目前*受关注的大数据处理平台和解决方案,并且已经广泛应用于生产环境。本书主要介绍Hadoop技术的相关知识,不但详细介绍了Hadoop、MapReduce、HDFS、Hive和Sqoop,还深入探讨了Hadoop的运维和调优,并包含了一个具有代表性的完整的基于Hadoop的商业智能系统的设计和实现。 本书的**特点是面向实践。基础篇介绍Hadoop及相关组件的同时,包含了大量动手实例,而应用篇包含的基于Hadoop的完整实例脱胎于生产环境的真实项目。在应用篇中,读者

    时间:2022-05-07

    详细内容
  • 《R与Hadoop大数据分析实战》素材

    《R与Hadoop大数据分析实战》素材

    本书出版后在Amazon上获得了极高的关注度,因为它是当时全球仅有的一本讲述R语言同Hadoop技术结合的权威书籍。我于当年年末拿到此书并仔细研读,在此过程中便萌发出把此书翻译为中文版本的想法。而机械工业出版社以极快的速度同我敲定此事,可见他们独到的眼光和敏锐的市场洞察力。 本书由10余位小伙伴共同翻译而成,整个翻译过程充分体现了当下互联网的合作精神。首先我在个人博客以及豆瓣同城上发布了想翻译此书的想法,并迅速得到了几十

    时间:2022-04-07

    详细内容
  • 《Hadoop大数据挖掘从入门到进阶实战(视频教学版)》配书资源

    《Hadoop大数据挖掘从入门到进阶实战(视频教学版)》配书资源

    本书采用理论+实战的形式编写,全面介绍了Hadoop大数据挖掘的相关知识。作者为本书专门录制了配套教学视频,便于读者高效、直观地学习。本书分为13章,涵盖的主要内容有集群及开发环境搭建;快速构建一个Hadoop项目并线上运行;Hadoop套件实战;Hive编程;游戏玩家的用户行为分析;Hadoop平台管理与维护;Hadoop异常处理解决方案;Hadoop核心源码初识;Hadoop通信机制和内部协议;HDFS核心模块分析;ELK实战案例;Kafka实战案例;Hadoop拓展。本书不但适合刚

    时间:2022-02-10

    详细内容
  • Hadoop高级编程:构建与实现大数据解决方案

    Hadoop高级编程:构建与实现大数据解决方案

    Hadoop高级编程:构建与实现大数据解决方案 作者:(美)Boris Lublinsky,(美)Kevin T. Smith,(美)Alexey Yakubovich 著; 穆玉伟,靳晓辉 译 出版时间:2014 如果你已经准备好要充分实施大规模可扩展性数据分析工作,那么需要知道如何利用Hadoop技术。《Hadoop高级编程:构建与实现大数据解决方案》可以帮助你做到这一点!本书关注用于构建先进的、基于Hadoop的企业级应用的架构和方案,并为实现现实的解决方案提供深入的、代码级的讲解。本书还会带你领略

    时间:2021-12-31

    详细内容
  • Hadoop源代码分析 第二版(修订版)

    Hadoop源代码分析 第二版(修订版)

    Hadoop源代码分析 第二版(修订版) 作者:张鑫 著 出版时间:2014年版 丛编项:深入云计算 本书是一本全面细致介绍和分析Hadoop源码和内部工作机理的技术书籍,通过对Hadoop内部源码详细透彻的解析,使读者能够快速高效地掌握Hadoop的内部工作机制,了解Hadoop内部源码架构,对Hadoop有更加深刻的认识。 本书主要对Hadoop最核心的部分:HDFS和MapReduce进行源码解析和说明。适合所有想全面学习Hadoop开发技术的人员阅读,也适用于使用Hadoop进行开发的工程技术

    时间:2021-12-31

    详细内容
  • Hadoop技术内幕:深入解析YARN架构设计与实现原理

    Hadoop技术内幕:深入解析YARN架构设计与实现原理

    Hadoop技术内幕:深入解析YARN架构设计与实现原理 作者:董西成 著 出版时间:2014年版 《Hadoop技术内幕:深入解析YARN架构设计与实现原理》是“Hadoop技术内幕”系列的第3本书,前面两本分别对Common、HDFS和MapReduce进行了深入分析和讲解,赢得了极好的口碑,Hadoop领域几乎人手一册,本书则对YARN展开了深入的探讨,是首部关于YARN的专著。仍然由资深Hadoop技术专家董西成执笔,根据最新的Hadoop 2.0版本撰写,权威社区ChinaHadoop鼎力推荐。

    时间:2021-12-02

    详细内容
  • Hadoop技术内幕:深入解析MapReduce架构设计与实现原理

    Hadoop技术内幕:深入解析MapReduce架构设计与实现原理

    Hadoop技术内幕:深入解析MapReduce架构设计与实现原理 作者:董西成 著 出版时间:2013年版 “Hadoop技术内幕”共两册,分别从源代码的角度对“Common+HDFS”和“MapReduce的架构设计和实现原理”进行了极为详细的分析。本书由Hadoop领域资深的实践者亲自执笔,首先介绍了MapReduce的设计理念和编程模型,然后从源代码的角度深入分析了RPC框架、客户端、JobTracker、TaskTracker和Task等MapReduce运行时环境的架构设计与实现原理,最后从实

    时间:2021-08-18

    详细内容
  • 《大数据Hadoop 3.X分布式处理实战》配套资源

    《大数据Hadoop 3.X分布式处理实战》配套资源

    内容介绍 本书以实战开发为原则,以Hadoop 3.X生态系统内的主要大数据工具整合应用及项目开发为主线,通过Hadoop大数据开发中常见的11个典型模块和3个完整项目案例,详细介绍HDFS、MapReduce、HBase、Hive、Sqoop、Spark等主流大数据工具的整合使用。本书附带资源包括本书核心内容的教学视频,本书所涉及的源代码、参考资料等。 全书共14章,分为3篇,涵盖的主要内容有Hadoop及其生态组件伪分布式安装和完全分布式安装、分布式文件系统HDFS、分布式计算框架

    时间:2021-04-30

    详细内容
  • Hadoop大数据开发实战

    Hadoop大数据开发实战

    Hadoop大数据开发实战 出版时间:2019 本书将大数据技术生态圈主流技术框架的应用与发展、搭建Hadoop大数据分布式系统集群平台、大数据分布式文件系统HDFS(Hadoop Distributed File System)、大数据分布式并行计算框架MapReduce、大数据汽车销售数据统计分析项目5大模块分为11章内容进行阐述。具体分布情况如下:第1章是大数据概论,介绍大数据的发展背景及基本概念;第2章是搭建Hadoop分布式集群;第3~6章是HDFS分布式文件系统入门、HDFS接口、HDFS的运

    时间:2021-03-09

    详细内容
  • Hadoop大数据分析与挖掘实战

    Hadoop大数据分析与挖掘实战

    10多位技术专家结合自己10多年的经验,以电信、航空、医疗等多个行业的实战案例为主线,深入浅出地讲解了如何基于Hadoop架构技术进行大数据挖掘建模、数据分析和二次开发。 本书共16章,

    时间:2020-09-26

    详细内容
  • Hadoop YARN权威指南

    Hadoop YARN权威指南

    《Hadoop YARN权威指南》由YARN的创建和开发团队亲笔撰写,Altiscale的CEO作序鼎力推荐,是使用Hadoop YARN建立分布式、大数据应用的权威指南。书中利用多个实例,详细介绍Hadoop YARN的安装和管理,

    时间:2020-05-16

    详细内容
  • Hadoop安全:大数据平台隐私保护

    Hadoop安全:大数据平台隐私保护

    伴随着应用Hadoop储存并解决很多数据信息的公司持续增加,Hadoop安全系数日渐突显,尤其是在金融业和诊疗等涉及到比较敏感信息内容的制造行业。

    时间:2020-04-28

    详细内容
  • Hadoop硬实战

    Hadoop硬实战

    Hadoop 是一个开源的MapReduce 平台,设计运行在大型分布式集群环境中,为开发者进行数据存储、管理以及分析提供便利的方法。《Hadoop硬实战》详细讲解了Hadoop 和MapReduce 的基本概念,并收集了

    时间:2019-12-16

    详细内容
  • Hadoop集群与安全

    Hadoop集群与安全

    时间:2019-11-22

    详细内容
  • Hadoop云计算一体机实践指南

    Hadoop云计算一体机实践指南

    时间:2019-11-22

    详细内容
  • Hadoop大数据处理技术基础与实践

    Hadoop大数据处理技术基础与实践

    时间:2019-11-04

    详细内容
  • Hadoop大数据实战权威指南

    Hadoop大数据实战权威指南

    大数据贵在落实! 本书是一本讲解大数据实战的图书,按照深入分析组件原理、充分展示搭建过程、详细指导应用开发编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数

    时间:2019-10-25

    详细内容
  • Hadoop大数据处理

    Hadoop大数据处理

    时间:2019-08-17

    详细内容
  • 实战Hadoop2.0:从云计算到大数据

    实战Hadoop2.0:从云计算到大数据

    时间:2019-08-17

    详细内容
  • Hadoop深度学习

    <b>Hadoop深度学习</b>

    本书用Hadoop在深度神经网络中部署大数据 deeplearning 深度学习,处理很多深度学习应用的热点问题并向读者披露解决方案的细节,欢迎下载

    时间:2019-06-10

    详细内容
  • Spark与Hadoop大数据分析

    Spark与Hadoop大数据分析

    这本书系统讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,配套详细的实现示例,是快速掌握大数据分析基础架构及其实施方法的详实参考

    时间:2019-04-23

    详细内容
  • Elasticsearch集成Hadoop最佳实践

    Elasticsearch集成Hadoop最佳实践

    ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。本书全面介绍Elasticsearch Hadoop技术用于大数据分析以及数据可视化的方法,感兴趣的小伙伴们可以参考一下

    时间:2019-04-12

    详细内容
  • Hadoop+Spark生态系统操作与实战指南

    Hadoop+Spark生态系统操作与实战指南

    本书帮助读者快速上手Hadoop+Spark,全面解析Hadoop和Spark生态系统,通过实际操作,快速学习Hadoop+Spark大数据技术,使得读者了解当今互联网应用极为广泛的集群技术

    时间:2019-03-29

    详细内容

“Hadoop”笔记推荐

深入浅析Java Object Serialization与 Hadoop 序列化

弓天翰

一,Java Object Serialization 1,什么是序列化(Serialization) 序列化是指将结构化对象转化为字节流以便在网络上传输或者写到磁盘永久存储的过程。反序列化指将字节流转回结构化对象的逆过程。简单的理解就是对象转换为字节流用来传输和保存,字节流转换为对象将对象恢复成原来的状态。 2,序列化(Serialization)的作用 (1)一种持久化机制,把的内存中的对象状态保存到一个文件中或者数据库。 (2)一种通信机制,用套接字在网络上传送对象。 (3)Java远程方法调用(RMI)需要调用对象时, 3,实现了Serializable接口的对象的序列化 在java.io包中,接口Serialization用来作为实现对象串行化的工具 ,只有实现了……

实例详解hadoop中实现java网络爬虫

蔡华皓

这一篇网络爬虫的实现就要联系上大数据了。在前两篇java实现网络爬虫和heritrix实现网络爬虫的基础上,这一次是要完整的做一次数据的收集、数据上传、数据分析、数据结果读取、数据可视化。 需要用到 Cygwin:一个在windows平台上运行的类UNIX模拟环境,直接网上搜索下载,并且安装; Hadoop:配置Hadoop环境,实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS,用来将收集的数据直接上传保存到HDFS,然后用MapReduce分析; Eclipse:编写代码,需要导入hadoop的jar包,以可以创建MapReduce项目; Jsoup:html的解析jar包,结合正则表达式能更好的解析网页源码; ----- 目录: 1、配置Cygwin 2、配置Hadoo……

Hadoop 中 HBase Shell命令的详解

宿溶溶

Hadoop 中 HBase Shell命令的详解 HBase包含可以与HBase进行通信的Shell。 HBase使用Hadoop文件系统来存储数据。所有这些任务发生在HDFS。下面给出的是一些由 常用的HBase Shell命令。 数据操纵语言 命令 说明 命令表达式 create 创建一个表 create '表名称', '列名称1','列名称2','列名称N' put 添加记录 put '表名称', '行名称', '列名称:', '值' get 查看记录 get '表名称', '行名称' count 查看表中的记录总数 count '表名称' delete 删除记录 delete '表名' ,'行名称' , '列名称' scan 查看所有数据 scan "表名称" scan 查看表某列数据 scan "表名称" , ['列名称:'] 数据定义语言 list 列出HBase的所有表 disable 禁用表 disable '表名称' is_disabled 验证表是否被……

Hadoop多Job并行处理的实例详解

甘芷文

Hadoop多Job并行处理的实例详解 有关Hadoop多Job任务并行处理,经过测试,配置如下: 首先做如下配置: 1、修改mapred-site.xml添加调度器配置: property namemapred.jobtracker.taskScheduler/name valueorg.apache.hadoop.mapred.FairScheduler/value/property 2、添加jar文件地址配置: property namehadoopTest.jar/name value所生成jar的地址/value/property Java基本代码如下: // 获取各个Job,有关Job的创建,这里就不贴上来了。Job job_base = (Job) 。。。;Job job_avg = (Job) 。。。;Job job_runCount = (Job) 。。。;Job job_activeUser = (Job) ....;job_base.setJarByClass(CapuseDateTimerTask.class);job_avg.setJarByClass(CapuseDateTimerTask.class);job_runCount.setJarByClass(CapuseDateTimerTask.class);job_activeUser.setJa……

Java/Web调用Hadoop进行MapReduce示例代码

陆访枫

Hadoop环境搭建详见此文章//www.jb51.net/article/33649.htm。 我们已经知道Hadoop能够通过Hadoop jar ***.jar input output的形式通过命令行来调用,那么如何将其封装成一个服务,让Java/Web来调用它?使得用户可以用方便的方式上传文件到Hadoop并进行处理,获得结果。首先,***.jar是一个Hadoop任务类的封装,我们可以在没有jar的情况下运行该类的main方法,将必要的参数传递给它。input 和output则将用户上传的文件使用Hadoop的JavaAPI put到Hadoop的文件系统中。然后再通过Hadoop的JavaAPI 从文件系统中取得结果文件。 搭建JavaWeb工程。本文使用Spring、SpringMVC、MyBatis框架, 当然,这不是重点,就算没有使用任何框架也能实现。 项目框……