
深度实践Spark机器学习 PDF 超清版
- 大小:102 MB
- 类型:Spark
- 格式:PDF
- 热度:575
- 作者:吴茂贵
- 更新:2023-03-07 10:48:15

给大家整理了Spark相关的资料,介绍了关于Spark、机器学习方面,格式为PDF,资源大小102 MB,目前在Spark类资源综合评分为:8.9分。
深度实践Spark机器学习电子书封面 读者评价 本课程主要讲解基于Spark 2.x的机器学习库,MLlib实现了常用的机器学习,如:聚类、分类、回归等6大算法,使用Kaggle竞赛数据集模型构建。本课拒绝枯燥的讲述,将循序渐进从Spark2.x的基础知识开始,然后再透彻讲解各个算法的理论、详细展示Spark实现,最后均会通过实例进行解析实战,帮助大家真正从理论到实践全面掌握Spark MLlib分布式机器学习。通过该课程的学习同学们可以全面掌握Spark MLlib机器学习,进而能够在实际工作中进行ML的应用开发和定制开发。 内容介绍 本书系统讲解了Spark机器学习的技术、原理、组件、算法,以及构建Spark机器学习系统的方法、流程、标准和规范。此外,还介绍了Spark的深度学习框架TensorFlowOnSpark,以及如何借助它实现卷积神经网络和循环神经网络。 全书共14章,分为四个部分: *部分(1~7章) 主要讲解了Spark机器学习的技术、原理和核心组件,包括Spark ML、Spark ML Pipeline、Spark MLlib,以及如何构建一个Spark机器学习系统。 第二部分(8~12章) 主要以实例为主,讲解了Spark ML的各种机器学习算法,包括推荐模型、分类模型、聚类模型、回归模型,以及PySpark决策树模型和Spark R朴素贝叶斯模型。 第三部(第13章) 与之前的批量处理不同,本章以在线数据或流式数据为主,讲解了Spark的流式计算框架Spark Streaming。 第四部分(第14章) 介绍了Spark深度学习,主要包括TensorFlow的基础知识及它与Spark的整合框架TensorFlowOnSpark。 目录 前言 第1章了解机器学习1 第2章构建Spark机器学习系统6 第3章MLPipeline原理与实战34 第4章特征提取、转换和选择42 频率(TF-IDF)42 第5章模型选择和优化72 第6章SparkMLlib基础79 第7章构建SparkML推荐模型90 第8章构建SparkML分类模型99 第9章构建SparkML回归模型114 第10章构建SparkML聚类模型127 第11章PySpark决策树模型137 第12章SparkR朴素贝叶斯模型155 说明157 第13章使用SparkStreaming构建在线学习模型168
相关资源
-
《数字媒体运营方法与实务》配套资源
★书名:数字媒体运营方法与实务 ★书号:978-7-115-54979-2 ★简介:本书基于理论,辅以大量实例,通过数字媒体运营的基础知识、图文媒体平台运营实务、短视频媒体运营实务、直播媒体运营实务、用户运营、活动策划以及数字媒体运营实战案例等7章内容,深入浅出地讲解了数字媒体运营的思维与方法。同时,每章章末还提供模拟题及作业,有助于考生高效备考。本书内容丰富、结构清晰、语言简练、图文并茂,具有较强的实用性和参考性,不仅可以
大小:190.9 MB数字媒体运营配套资源
-
计算机图形学(第三版) 课后答案
本书介绍计算机图形学的有关原理、算法及系统,主要内容有:计算机图形硬件、图形国际标准、交互技术与用户接口、实用的图形程序库、自由曲线和曲面、几何造型、真实图形显示、图象处理等。这些内容反映了90年代以来国内外,尤其是我们在计算机图形学领域的最新成果。 本书作为高等院校本科生、研究生学习计算机图形学或计算机图形学基础的教材,也可供技术人员从事有关专业工作参考。 本书已伴随着计算机科学与技术的发展茁壮成长了三
大小:1.98 MB计算机图形学课后答案
-
数学模型(第3版) 课后答案
《数学模型(第三版)》是由姜启源、谢金星、叶俊编,高等教育出版社2003年8月出版的教材。该书可作为高等学校各专业学生数学建模课程的教材和参加数学建模竞赛的辅导材料,以及科技工作者的参考书。 全书共分十三章,主要内容包括建立数学模型、初等模型、简单的优化模型以及数学规划模型、微分方程模型、稳定性模型等多种模型。 目录 第1章 建立数学模型 1.1 从现实对象到数学模型 1.2 数学建模的重要意义 1.3 建模示例之一椅子能在不平的地
大小:25.6 MB数学课后答案
-
《Python面向对象编程指南》源代码
编辑推荐 本书致力于深入讲解Python语言的高级特性,通过丰富、强大的代码示例为读者循序渐进地讲解如何编写高质量的Python代码。本书可谓是成就Python编程高手的必读之选。本书通过实际的例子对Python中面向对象编程的理念进行介绍。针对所有可用于和Python内置功能进行无缝结合的特殊方法,本书都提供了详细示例,并且介绍了如何使用JSON、YAML、Pickle、CSV、XML、Shelve和SQL来创建持久化对象以及在进程间传输对象。本书还介绍了Logging和Warning模块、单
大小:337.83 KBPython编程配套资源
-
Oracle11g数据库基础教程 课后答案
《Oracle11g数据库基础教程/计算机类本科规划教材》以一个人力资源管理系统案例开发与管理为主线,深入浅出地介绍Oracle 11g数据库系统开发与管理的基础知识。全书包括4个部分。第一部分介绍Oracle数据库系统的构建,包括数据库服务器的安装与配置、数据库常用管理与开发工具和数据库体系结构等;第二部分介绍人力资源管理系统数据库开发,包括数据库的创建、数据库存储结构设置、数据库对象的创建与应用、利用SQL语句与数据库交互、利用PL/SQL进
大小:21.5 MBOracle11g教程课后答案
-
《从实践中学习Nmap渗透测试》配书资源
Nmap是知名的网络安全审计工具,可以帮助安全人员发现设备,探测开启的端口号,分析设备使用的操作系统和开启的服务,探测设备存在的漏洞。本书详细介绍如何使用Nmap工具实施渗透测试。 本书共19章,分为2篇。第1篇Namp环境配置与网络扫描,主要介绍Namp的环境配置,以及确定目标、发现主机、扫描端口、服务与系统探测、扫描优化、规避防火墙与IDS、保存和输出Nmap信息等基础知识;第2篇Namp脚本实战,涵盖探测网络基础环境、探测网络基础服务、
大小:147.2 MBNmap配套资源
-
Tensorflow 2.0入门教程
Google大佬Josh Gordon发布Tensorflow 2.0入门教程。TensorFlow 2.0删除了冗余的API,完全采用Keras作为高级应用程序编程接口(API),使API更加一致(统一RNNs, 统一优化器),并通过Eager execution更好地与Python集成。 并附带介绍了TensorFlow2.0 的一些新的特征与使用技巧,需要的朋友可下载试试! TensorFlow是一个采用数据流图(data flow graphs),用于数值计算的开源软件库。 TensorFlow
大小:3.51 MBTensorflow
-
微型计算机原理及其应用 课后答案
《微型计算机原理及其应用》是2009年8月湖南大学出版社出版的图书,作者是彭楚武、张志文。 《高等学校电气信息类教材:微型计算机原理及其应用》是为高等理工科院校电气信息类及相关专业本科生编写的教科书。《高等学校电气信息类教材:微型计算机原理及其应用》分别以Intel 8086微处理器和MC:S-51单片机构成的微机系统为对象,对微机的基本结构、工作原理、汇编语言程序设计、接口技术和基本接口芯片进行了较为详细的讨论。 [2] 《高等学校
大小:55.7 MB微型计算机课后答案
下载地址
相关声明: