当前位置：主页 > 计算机电子书 > 程序设计 > Spark电子书下载

Spark Streaming技术内幕及源码剖析

Spark Streaming技术内幕及源码剖析

更新：2019-11-27
大小：204 MB
类别：Spark
作者：王家林、夏阳
出版：清华大学出版社
版本：PDF 完整版

高速下载(提取码：jww3)

资源介绍
相关推荐

本书以大数据处理引擎Spark的稳定版本1.6.x为基础，从应用案例、原理、源码、流程、调优等多个角度剖析Spark上的实时计算框架Spark Streaming。在勾勒出Spark Streaming架构轮廓的基础上，从基本源码开始进行剖析，由浅入深地引导已具有Spark和Spark Streaming基础技术知识的读者进行Spark Streaming的进阶学习，理解Spark Streaming的原理和运行机制，为流数据处理的决策和应用提供了技术参考；结合Spark Streaming的深入应用的需要，对Spark Streaming的性能调优进行了分析，也对Spark Streaming功能的改造和扩展提供了指导。本书适合大数据领域CTO、架构师、高级软件工程师，尤其是Spark领域已有Spark Streaming 基础知识的从业人员阅读，也可供需要深入学习Spark、Spark Streaming的高校研究生和高年级本科生参考。

目录

第1章 Spark Streaming应用概述······1
1.1 Spark Streaming应用案例 ·······2
1.2　Spark Streaming应用剖析 ·····13
第2章 Spark Streaming基本原理····15
2.1　Spark Core简介 ··················16
2.2 Spark Streaming设计思想 ·····26
2.3 Spark Streaming整体架构 ·····30
2.4 编程接口 ·························33
第3章 Spark Streaming运行流程详解·············39
3.1 从StreamingContext的初始化到启动 ··········40
3.2 数据接收 ·························54
3.3 数据处理 ·························91
3.4 数据清理 ························115
3.5 容错机制 ························127
3.5.1 容错原理 ·························128
3.5.2 Driver容错机制 ·················152
3.5.3 Executor容错机制 ··············161
3.6 No Receiver方式 ···············167
3.7 输出不重复 ·····················175
3.8 消费速率的动态控制 ·········176
3.9 状态操作 ························189
3.10 窗口操作 ·······················212
3.11 页面展示 ·······················216
3.12 Spark Streaming应用程序的停止··········227
第4章Spark Streaming 性能调优机制···········237
4.1 并行度解析 ·····················238
4.1.1 数据接收的并行度 ·············238
4.1.2 数据处理的并行度 ·············240
4.2 内存······························240
4.3 序列化 ···························240
4.4 Batch Interval ···················241
4.5 Task ·······························242
4.6 JVM GC ·························242
第5章Spark 2.0中的流计算··········245
5.1 连续应用程序 ··················246
5.2 无边界表unbounded table ····248
5.3 增量输出模式 ··················249
5.4 API简化 ··························250
5.5 其他改进 ························250

资源获取

高速下载(提取码：jww3)

相关资源

网友留言

最近更新

05-29Python视觉实战项目31讲
05-29Go语言面试八股文大全
05-29MySQL 8.4中文手册
05-29华为OD机考100题(真题)
05-29Python+OpenCV入门计算机视觉实战项目52讲 v1.0
05-21Modbus协议
05-21PCIE规范合集(PCI_Express_Base 1.0/2.1/3.0/4.0/5.0/6.0)
05-21深入理解Rust并发编程

热门资源

精选留言