大数据技术体系详解：原理、架构与实践

更新：2023-07-24
大小：96.2 MB
类别：大数据
作者：董西成
出版：机械工业出版社
版本：PDF 全书超清版

资源介绍
相关推荐

【大数据技术体系详解：原理、架构与实践】本书系统、深度地讲解了大数据技术体系，包含数据收集、数据存储、资源管理与服务协调、计算引擎、数据分析、数据可视化等六个层次。读者可以通过本书了解到整个大数据技术体系中所有核心技术的原理、架构与实践。这本书逻辑清晰，内容详尽，对于研究大数据领域的人员来说是一本难得的宝典。无论是初学者还是在职人员，都能从中获得实用的知识和经验。对于想要深入了解大数据技术的读者来说，这本书是一本值得推荐的参考资料。

大数据技术体系详解

大数据技术体系详解电子书封面

读者评价

适合入门，了解整个大数据技术体系，介绍得比较全面，易懂

体系比较完善，没有太多废话，不是堆代码，适合大数据从业人员中级以下水平的读物

对了解大数据的总体架构和主要组建有帮助

内容介绍

本书从大数据落地应用的角度，系统阐述了从数据采集到数据存储的大数据、分布式协调和资源管理、计算引擎、分析工具，再到数据可视化的完整过程，这本书不仅包含了主要技术的实现原理和框架，还有具体的落地指导是帮助企业和个人整体理解大数据框架的难得参考书。本章主要包括6部分16章，其中：第一部分介绍了大数据架构谷歌和Hadoop技术栈；第二部分介绍了大数据分析的相关技术，主要涉及关系数据收集工具Sqoop和Canel、非关系数据收集系统Flume和分布式消息队列Kafka；第三部分介绍了大数据存储的相关技术，涉及数据存储格式、分布式文件系统和分布式数据库；第四部分介绍了资源管理和服务协调的相关技术，涉及资源管理和调度系统纱和资源协调系统ZooKeeper；第五部分介绍了计算引擎的相关技术，涉及到批处理、交互式处理和流式实时处理引擎；第六部分是数据分析技术，基于数据分析语言HQL和SQL、大数据统一编程模型和机器学习库等。

第一部分　概述篇
第1章　企业级大数据技术体系概述 2
第二部分　数据收集篇
第2章　关系型数据的收集 20
第3章　非关系型数据的收集 36
第4章　分布式消息队列Kafka 51
第三部分　数据存储篇
第5章　数据序列化与文件存储格式 70
第6章　分布式文件系统 90
第7章　分布式结构化存储系统 104
第四部分　分布式协调与资源管理篇
第8章　分布式协调服务ZooKeeper 130
第9章　资源管理与调度系统YARN 146

资源获取

高速下载(提取码：gbb1)

网友留言

司兴平 2019-04-03 10:44:54

从一开始的python基础，关系型数据库MySQL等，到现在学习的数据分析以及处理，从一开始对大数据分析的陌生，到现在有了一定的项目开发经验，三个月的时间，大数据培训带给自己的不仅仅是知识层面的提升，还有项目经验的实践分享都让我成长了很多。有多少付出就有多少回报，在科多大数据培训班上，我可能比别的同学少了一些基础，那我就要努力补回来!在科多，我更是学会了要朝着自己的目标奋勇前进!现在的日子虽然每天学习压力非常大，我必坚持不放弃。

程永望 2019-04-03 10:44:17

大数据培训如火如荼地进行着，想想自己在参加培训之前的犹豫，在加入千锋大数据培训班的两个月之后，真心为自己当初的决定感到庆幸。这两个月的时间改变了我很多，刚入学时候的我，多么盼望着早日学成，步入社会迎接各种挑战。可是慢慢的我知道不能急于求成，心急吃不了热豆腐。还记得转折点是在于有一次周考结束后，看着自己的成绩是在是不如人意，正心灰意冷，心想着自己是否不适合这个行业，想要放弃的时候。老师找到我，开导我说像我这种跨行来到千锋参加大数据培训的学员比比皆是。像我们这种零基础学员选择大数据，就要一步一步把基础学牢固，不要想着赶快学完，基础学不牢固在以后的学习中很容易就“崩”掉的。