当前位置:首页 > 数据库 >
《大数据学习笔记(Hadoop学习文档)》电子书封面

大数据学习笔记(Hadoop学习文档)

  • 发布时间:2020年07月29日 10:54:22
  • 作者:蔡修杰
  • 大小:20.5 MB
  • 类别:Hadoop电子书
  • 格式:PDF
  • 版本:超清版
  • 评分:8.3

    大数据学习笔记(Hadoop学习文档) PDF 超清版

      给大家带来的一篇关于Hadoop相关的电子文档资源,介绍了关于大数据、Hadoop手册、Hadoop大数据、Hadoop方面的内容,本书是由Hadoop官网出版,格式为PDF,资源大小20.5 MB,蔡修杰编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.2。

      内容介绍

      Hadoop学习文档是一本关于大数据学习记录的手册,讲述分布式系统基础架构Hadoop的安装部署,及过程中遇到的一些问题及解决方案,必备学习指南,需要的朋友可下载试试!

      主要针对初学者,做为一个老IT工作者,学习是一件很辛苦的事情,希望这本手册对帮助大家快速的学习与认识大数据(特指Hadoop Spark),为了不让初学者一下接触爆炸式的新概念,我们会以实验先行,概念跟进的方式进行课程学习,这样有利于大家快速进入状态,而不至于一直深陷逻辑概念出不来, 但是每个人的学习方式不一样,仁者见仁智者见智吧!

      本手册详细分析了hadoop的基本构成和原理,hbase的基本原理和常用命令,hive的原理和常用命令等。非常详细!

      目录

      • 第一章 概念
      • 第二章 云计算技术
      • 第三章 Hadoop是什么
      • 第四章 Hadoop的安装
      • 第五章 Ambari集群管理
      • 第六章 Hive
      • 第七章 Sqoop
      • 第八章 HBASE
      • 第九章 HBASE实战
      • 第十章 Spark
      • 第十一章 CDH的发行版本
      • 第十二章 TDH发行版本
      • 第十三章 HUE安装与配置
      • 第十四章 数据采集与爬虫
      • 第十五章 Hadoop相关资源
      • 第十六章 大数据框架合集
      • 第十七章 运维
      • 第十八章 机器学习入门
      • 第十九章 Centos下的Oracle安装
      • 第二十章 基于JFinal的大数据框架快速开发
      • 附录 Hadoop运维技能要求

      学习笔记

      基于Hadoop实现Knn算法

      Knn算法的核心思想是如果一个样本在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。该方法在确定分类决策上只依据最邻近的一个或者几个样本的类别来决定待分样本所属的类别。Knn方法在类别决策时,只与极少量的相邻样本有关。由于Knn方法主要靠周围有限的邻近的样本,而不是靠判别类域的方法来确定所属类别的,因此对于类域的交叉或重叠较多的待分样本集来说,Knn方法较其他方法更为合适。 Knn算法流程如下: 1. 计算当前测试数据与训练数据中的每条数据的距离 2. 圈定距离最近的K个训练对象,作为测试对象的近邻 3. 计算这……

      Hadoop Combiner使用方法详解

      Hadoop Combiner使用方法详解 Combiner函数是一个可选的中间函数,发生在Map阶段,Mapper执行完成后立即执行。使用Combiner有如下两个优势: Combiner可以用来减少发送到Reducer的数据量,从而提高网络效率。 Combiner可以用于减少发送到Reducer的数据量,这将提高Reduce端的效率,因为每个reduce函数将处理相对较少记录,相比于未使用Combiner之前。 Combiner与Reducer结构相同,因为Combiner和Reducer都对Mapper的输出进行处理。这给了我们一个复用Reducer作为Combiner的好机会。但问题是,复用Reducer作为Combiner总是是一个好主意吗? 特点: Combiners是MapReduce中的一个优化,允许在shuffle和排序阶段之前在本地进行聚合。Combiners的首要……

      以上就是本次介绍的Hadoop电子文档的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:IBM SDK Java V8用户指南中文版(2019)

      下一篇:没有了

      展开 +

      收起 -

      下载地址:百度网盘下载
      Hadoop相关电子书
      读者留言
      苏煜祺

      苏煜祺 提供上传

      资源
      27
      粉丝
      19
      喜欢
      86
      评论
      7

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com