当前位置:首页 > 电子书 > 电子书下载 > 程序设计 >
Python+Spark2.0+Hadoop机器学习与大数据实战 Python+Spark2.0+Hadoop机器学习与大数据实战
亮剑2018

亮剑2018 提供上传

资源
34
粉丝
14
喜欢
282
评论
8

    Python+Spark2.0+Hadoop机器学习与大数据实战 PDF 原书扫描版

    Hadoop电子书
    • 发布时间:2019-06-03 09:36:06

    给大家带来的一篇关于Hadoop相关的电子书资源,介绍了关于Python、Spark2.0、Hadoop、机器学习、大数据方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小109 MB,林大贵编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.7。

  • Python+Spark2.0+Hadoop机器学习与大数据实战 PDF 下载
  • 下载地址:https://pan.baidu.com/s/19QdQQbyvhYh8wDXNS9ppM
  • 提取码:k882
  • Python+Spark2.0+Hadoop机器学习与大数据实战

    Python+Spark2.0+Hadoop机器学习与大数据实战

    读者评价

    做分布式作业的时候参考过这本书,作者写得挺仔细的作为入门真的挺棒。就是作者留的配套代码是用百度网盘的地址,我当时下的时候已经失效了后来找作者要了一份。我已经上传到github了,希望帮到后来的人https://github.com/crabdriver/Python-Spark-2.0-Hadoop-
    首先请作者不要介意 不过看了之后对Hadoop和Spark基本没啥了解 印象深的是冗长的环境搭建描述 总之不推荐阅读
    虽然内容可能没有很深入,但作者非常用心的把每一步操作详细的列出来并给出说明,让我们跟着做的时候非常有信心,没有出现奇奇怪怪的报错,没有不知道为啥就是进行不下去的情况。这本书用实例告诉你spark,hdfs的基础使用和操作方法,让你快速入门,懂得操作。后面再进行针对性的入门和进阶,就会非常顺手

    内容介绍

    《Python+Spark 2.0+Hadoop机器学习与大数据实战》从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分类、分析、训练、建模、预测、机器学习(推荐引擎)、机器学习(二元分类)、机器学习(多元分类)、机器学习(回归分析)和数据可视化应用等。

    书中不仅加入了新近的大数据技术,还丰富了“机器学习”内容。 为降低读者学习大数据技术的门槛,书中提供了丰富的上机实践操作和范例程序详解,展示了如何在单机Windows系统上通过Virtual Box虚拟机安装多机Linux虚拟机,如何建立Hadoop集群,再建立Spark开发环境。书中介绍搭建的上机实践平台并不限制于单台实体计算机。对于有条件的公司和学校,参照书中介绍的搭建过程,同样可以实现将自己的平台搭建在多台实体计算机上,以便更加接近于大数据和机器学习真实的运行环境。

    本书非常适合于学习大数据基础知识的初学者阅读,更适合正在学习大数据理论和技术的人员作为上机实践用的教材。

    目录

    • 第1章 Python Spark机器学习与Hadoop大数据 1
    • 第2章 VirtualBox虚拟机软件的安装 19
    • 第3章 Ubuntu Linux 操作系统的安装 30
    • 第4章 Hadoop Single Node Cluster的安装 57
    • 第5章 Hadoop Multi Node Cluster的安装 80
    • 第6章 Hadoop HDFS命令 117
    • 第7章 Hadoop MapReduce 135
    • 第8章 Python Spark的介绍与安装 148
    • 第9章 在 IPythonNotebook 运行 Python Spark 程序 176
    • 第10章 Python Spark RDD 197
    • 第11章 Python Spark的集成开发环境 229
    • 第12章 Python Spark创建推荐引擎 281
    • 第13章 Python Spark MLlib决策树二元分类 311
    • 第14章 Python Spark MLlib 逻辑回归二元分类 361
    • 第15章 Python Spark MLlib支持向量机SVM二元分类 373
    • 第16章 Python Spark MLlib朴素贝叶斯二元分类 382
    • 第17章 Python Spark MLlib决策树多元分类 391
    • 第18章 Python Spark MLlib决策树回归分析 407
    • 第19章 Python Spark SQL、DataFrame、RDD数据统计与可视化 425
    • 第20章 Spark ML Pipeline 机器学习流程二元分类 462
    • 第21章 Spark ML Pipeline 机器学习流程多元分类 486
    • 第22章 Spark ML Pipeline 机器学习流程回归分析 499

    上一篇:全国计算机等级考试二级教程:Python语言程序设计

    下一篇:Spring实战(中文4,5版)

    展开 +

    收起 -

     
    Hadoop 相关内容
    Python程序设计开发宝典
    Python程序设计开发宝典 高质量清晰版

    本书深入剖析Python 3.5.x、Python 3.6.x及更新版本的内置对象和标准库对象高级用法,150个案例源代码和超过1000个演示性代码片段,可以作为Python程序设计教材

    立即下载
    Python数据可视化
    Python数据可视化 影印中文版

    本书介绍了利用Python实现数据可视化。并介绍了数据、信息与知识之间的关系,想要学习Python数据可视化的同学可以下载参考一下

    立即下载
    Python游戏编程入门
    Python游戏编程入门 中文扫描版

    本书为读者提供了充分的实践和练习,并且关注Python编程中的高级话题,这些全部通过游戏示例和项目来介绍,而这已经证明是一种高效而有趣的学习方法,感兴趣的可以了解一下

    立即下载
    深度实践Spark机器学习
    深度实践Spark机器学习 高质量扫描版

    本书系统讲解Spark机器学习技术、原理、算法和组件,以及构建Spark机器学习系统的方法、流程、标准和规范,介绍了Spark的深度学习框架TensorFlowOnSpark,以及如何借助它实现卷积神经网络和循环神经网络

    立即下载
    循序渐进学Spark
    循序渐进学Spark 原书影印版

    本书是引导读者深度学习Spark的技术指南,旨在用合理的结构和精炼的内容让读者用短的时间掌握Spark技术的核心内容,欢迎下载阅读

    立即下载
    PySpark实战指南
    PySpark实战指南 原书中文扫描版

    本书是一本Pyspark的实用参考指南,深度挖掘Python+Spark的强大功能,介绍了如何使用Python调用Spark新特性、处理结构化及非结构化数据、使用PySpark中基本可用数据类型等内容

    立即下载
    基于Hadoop与Spark的大数据开发实战
    基于Hadoop与Spark的大数据开发实战 原书影印版

    1、选取知识点核心实用,以互联网 实现终身学习 2、以企业需求为设计导向,以任务驱动为讲解方式 3、以案例为主线组织知识点,以实战项目来提升技术 4、充分考虑学习者的认知曲线,由浅入深,边讲边练

    立即下载
    Hadoop数据分析
    Hadoop数据分析 中文完整版

    通过提供分布式数据存储和并行计算框架,Hadoop已经从一个集群计算的抽象演化成了一个大数据的操作系统。本书旨在通过以可读且直观的方式提供集群计算和分析的概览,为数据科学家深入了解特定主题领域铺平道路,从数据科学家的视角介绍Hadoop集群计算和分析。

    立即下载
    Hadoop+Spark生态系统操作与实战指南
    Hadoop+Spark生态系统操作与实战指南 原书影印版

    本书帮助读者快速上手Hadoop+Spark,全面解析Hadoop和Spark生态系统,通过实际操作,快速学习Hadoop+Spark大数据技术,使得读者了解当今互联网应用极为广泛的集群技术

    立即下载
    Elasticsearch集成Hadoop最佳实践
    Elasticsearch集成Hadoop最佳实践 中文高清版

    ElasticSearch是一个开源的分布式搜索引擎,具有高可靠性,支持非常多的企业级搜索用例。本书全面介绍Elasticsearch Hadoop技术用于大数据分析以及数据可视化的方法,感兴趣的小伙伴们可以参考一下

    立即下载
    Spark与Hadoop大数据分析
    Spark与Hadoop大数据分析 超清影印版

    这本书系统讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,配套详细的实现示例,是快速掌握大数据分析基础架构及其实施方法的详实参考

    立即下载
    学习笔记
    网友NO.23635
    网友NO.23635

    搭建Spark 2.x+Python开发环境及基本开发入门
    1、快速环境搭建:导入Windows7虚拟机至VMWARE及启动系统和远程桌面连接
    2、快速环境搭建:Windows系统如何安装pyspark模块到Anaconda及启动PyCharm了解Spark MLlib机器学习库源码及走读
    3、快速环境搭建:使用PyCharm开发Spark程序(读取文本数据封装RDD)
    4、PySpark SQL快速开发:结构化海量数据处理框架SparkSQL介绍、DataFrame概述及分析数据两种方式
    5、PySpark SQL快速开发:使用SparkSession读取文本数据分析及CSV格式数据分析(封装DataFrame分布式数据集)
    6、PySpark SQL快速开发:基于Jupyter Notebook读取航空航天数据、使用DSL分析
    7、PySpark SQL快速开发:使用DSL分析航天航空数据及如何将DataFrame转换为Pandas中dataframe

    网友NO.27180
    网友NO.27180

    本课程系统讲解如何在Spark2.0上高效运用Python来处理数据并建立机器学习模型,帮助读者开发并部署高效可拓展的实时Spark解决方案。
    本课程从浅显易懂的“大数据和机器学习”原理说明入手,讲述大数据和机器学习的基本概念,如分析、分类、训练、建模、预测、推荐引擎、二元分类、多元分类、回归分析和Pipeline等;
    为降低学习大数据技术的门槛,提供了丰富的案例实践操作和范例程序编码,展示了如何在单机Windows系统上建立Spark 2.x + Python开发环境;
    适合于学习大数据基础知识的初学者,更适合正在使用机器学习想结合大数据技术的人员;

    电子书 编程教程 PC软件下载 安卓软件下载

    Copyright 2018-2020 xz577.com 码农之家

    本站所有电子书资源不再提供下载地址,只分享来路

    免责声明:网站所有作品均由会员网上搜集共同更新,仅供读者预览及学习交流使用,下载后请24小时内删除

    版权投诉 / 书籍推广 / 赞助:QQ:520161757