
Python+Spark2.0+Hadoop机器学习与大数据实战 PDF 原书扫描版
- 大小:109 MB
- 类型:Hadoop
- 格式:PDF
- 热度:695
- 作者:林大贵
- 更新:2019-06-03 09:36:06

为找资料的网友们整理了Hadoop相关的资料,介绍了关于Python、Spark2.0、Hadoop、机器学习、大数据方面,格式为PDF,资源大小109 MB,目前在Hadoop类资源综合评分为:8.3分。
Python+Spark2.0+Hadoop机器学习与大数据实战 读者评价 做分布式作业的时候参考过这本书,作者写得挺仔细的作为入门真的挺棒。就是作者留的配套代码是用百度网盘的地址,我当时下的时候已经失效了后来找作者要了一份。我已经上传到github了,希望帮到后来的人https://github.com/crabdriver/Python-Spark-2.0-Hadoop- 首先请作者不要介意 不过看了之后对Hadoop和Spark基本没啥了解 印象深的是冗长的环境搭建描述 总之不推荐阅读 虽然内容可能没有很深入,但作者非常用心的把每一步操作详细的列出来并给出说明,让我们跟着做的时候非常有信心,没有出现奇奇怪怪的报错,没有不知道为啥就是进行不下去的情况。这本书用实例告诉你spark,hdfs的基础使用和操作方法,让你快速入门,懂得操作。后面再进行针对性的入门和进阶,就会非常顺手 内容介绍 《Python+Spark 2.0+Hadoop机器学习与大数据实战》 从浅显易懂的大数据和机器学习原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。 书中不仅加入了新近的大数据技术,还丰富了机器学习内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校,参照书中介绍的搭建过程,同样可以实现将自己的平台搭建在多台实体计算机上,以便更加接近于大数据和机器学习真实的运行环境。 本书非常适合于学习大数据基础知识的初学者阅读,更适合正在学习大数据理论和技术的人员作为上机实践用的教材。 目录 第1章 Python Spark机器学习与Hadoop大数据 1 第2章 VirtualBox虚拟机软件的安装 19 第3章 Ubuntu Linux 操作系统的安装 30 第4章 Hadoop Single Node Cluster的安装 57 第5章 Hadoop Multi Node Cluster的安装 80 第6章 Hadoop HDFS命令 117 第7章 Hadoop MapReduce 135 第8章 Python Spark的介绍与安装 148 第9章 在 IPythonNotebook 运行 Python Spark 程序 176 第10章 Python Spark RDD 197 第11章 Python Spark的集成开发环境 229 第12章 Python Spark创建推荐引擎 281 第13章 Python Spark MLlib决策树二元分类 311 第14章 Python Spark MLlib 逻辑回归二元分类 361 第15章 Python Spark MLlib支持向量机SVM二元分类 373 第16章 Python Spark MLlib朴素贝叶斯二元分类 382 第17章 Python Spark MLlib决策树多元分类 391 第18章 Python Spark MLlib决策树回归分析 407 第19章 Python Spark SQL、DataFrame、RDD数据统计与可视化 425 第20章 Spark ML Pipeline 机器学习流程二元分类 462 第21章 Spark ML Pipeline 机器学习流程多元分类 486 第22章 Spark ML Pipeline 机器学习流程回归分析 499
相关资源
-
计算机控制系统 课后答案
《计算机控制技术》是2007年机械工业出版社出版的图书,作者是李华、范多旺、魏文军、侯涛。 本书全面、系统地阐述了计算机控制系统的结构、原理、设计和应用技术。 全书共分11章,包括:计算机控制系统概述、线性离散系统的数学描述和分析方法、计算机控制系统的多种控制算法、过程输入输出通道、网络控制技术、控制软件设计、控制系统的计算机仿真以及计算机控制系统的设计与工程实现等内容。本书注重了先进性、系统性和实用性。①增
大小:4.26 MB计算机系统课后答案
-
《C语言解惑》配套软件
本书分为上下两篇,上篇介绍了C语言程序设计中经常遇到的典型错误,其中不乏编程高手也经常会出现的错误。下篇主要从程序的质量出发,针对能够运行但质量不佳的程序或者设计方法,提出改进的建议。使读者完成从会编程到编出好程序的转变。 封面图 目录 前言 第一篇C语言编程中的对与错 第1章初涉C语言者的困惑2 1.1中文字符以假乱真2 1.2象形字体扰乱视听3 1.3都是注释惹的祸4 1.4千万不要忘记我4 1.5别把分号放错地方4 1.6少了花括号就是行不通
大小:1.6 MBC语言配套资源
-
Visual FoxPro程序设计 课后答案
本书是根据的计算机教学大纲,在作者总结多年从事Visual FoxPro程序设计教学经验的基础上编著而成的,全书共分10章,主要内容包括:数据库和数据库管理系统的基本概念、Visual FoxPro数据表和数据库的基本操作、传统的面向过程的程序设计方法、先进的面向对象的可视化程序设计方法和一个基于数据库的应用程序开发实例等。 本书的特点是概念清晰、编排合理、实例丰富,且理顺了众多知识点之间的关系,有利于读者的理解与掌握。在每章后均附有数
大小:195 KBVisual FoxPro课后答案
-
计算机组成原理教程(第四版) 课后答案
《信息管理学教程(第四版)》是2014年6月23日清华大学出版社出版的图书,作者是杜栋。 本书从管理科学领域出发,以信息科学理论为基础,对信息管理学的学科体系进行了探讨,阐述了信息管理的基本原理和方法,讨论了战略的信息管理和信息管理的组织问题,着重介绍了信息管理过程和信息管理系统。最后,书中还提供了信息管理的实证研究与案例分析内容。本次修订版紧跟大数据时代的步伐,探讨了大数据背景下的信息管理问题。本书不仅立意
大小:8.79 MB计算机组成课后答案
-
《Photoshop CC案例实战从入门到精通》光盘文件
本书精选最常用、最实用的11个种类,涉及特效文字、名片、杂志封面、POP艺术招贴、商业海报、手提袋、商业包装、网站硬广、商务网页、UI界面和商业广告等,堪称商业设计的经典案例合辑。每个案例都列出了详细的操作难度系数、技术点及创意特点,并以详细的操作步骤,解析了实例的制作方法为读者提供广泛的思路,借此案例,为读者抛砖引玉,开启一扇通往设计大师之门,使您感受Photoshop的强大功能以及它带来的无限创意。 封面图 目录 前言
大小:15.6 MBPhotoshop配套资源
-
java从入门到精通视频教程(全94讲)学习笔记+练习题答案
这是一份韩顺平Java从入门到精通视频全94讲的详细笔记,涵盖整个java体系,从基础到框架数据库等,对类、对象、修饰符、封装、继承、多态、异常、Servlet的生命周期、session、cookie等有详细讲解。后面附有源代码,有关于基本语法的知识,也有案例的讲解,非常适合初学者入门,需要的朋友可下载试试! 内容 第1章基本介绍 第2章界面设计 第3章系统模块分析 第4章数据库设计 第5章功能模块设计 第6章具体模块设计 第7章人性化设计分析 第8章总结 第
大小:3.2 MBjava
-
《Go Web编程》配套彩图
编辑推荐 Go语言通过提供整洁快速的编译代码、垃圾回收、简单的并发Go模型以及丰富的标准库来满足人们对于可扩展、高性能Web 应用的需求,这种语言非常适用于编写微服务,又或者用于构建可扩展且可维护的系统。本书将教读者运用现代化设计理念构建Go Web应用的方法。阅读本书能让读者学会如何通过依赖注入设计模式来编写测试替身,如何在Web应用中使用并发特性,还有如何在Web服务中创建以及处理JSON数据和XML数据。除此之外,读者还将学会如何
大小:10.15 MBWeb编程配套资源
-
《电商训练营:网店营销与推广》素材资源
编辑推荐 (1)19节高清教学视频,助力零起点读者轻松上手 (2)6大内容板块直击实战应用 数据分析+网店优化+活动营销+会员管理+运营推广 (3)6段式教学法保障学习目标达成 本章导读 知识点讲解 实战演练 同步操作教学视频 疑难解答 课后练习 (4)5类教学资源支持读者全方位学习 实例素材+效果文件+PPT课件+教学教案+拓展资源 内容简介 在当前电子商务的市场背景下,营销和推广已成为网店发展的必由之路。《电商训练营网店营销与推广》主要从店
大小:78.23 MB电商配套资源
下载地址
相关声明: