当前位置:主页 > 计算机电子书 > 数据库 > 大数据 pdf电子书下载
完整清晰反馈 / 投诉

企业数据湖 PDF 完整清晰版

2023-08-14 11:02:31 类别:大数据

  • 更新:2023-08-14 11:02:31
  • 大小:179.4 MB
  • 出版:机械工业出版社
  • 作者:汤姆斯·约翰
  • 类别:大数据
  • 格式:PDF

网盘下载 本地下载

扫二维码手机浏览

  • 码农点评:《企业数据湖》是一本内容丰富、论述透彻的关于大数据和企业数据湖的著作。书中分为三个主要部分,第一部分介绍了数据湖的概念及其在企业中的重要性,同时还介绍了Lambda架构的新进展,展示了其在数据湖中的应用。第二部分则深入研究了使用Lambda架构构建数据湖所需的主要组件,涵盖了一些流行的大数据技术。本书以清晰易懂的语言解释了复杂的概念,同时提供了实际案例与实用技巧,使读者能够深入了解数据湖的实际应用,并在企业中实施。对于对大数据和企业数据湖感兴趣的读者来说,这本书是一本不可多得的宝贵资源。
  • 资源介绍

    为网友们分享了大数据相关的 PDF电子书资料,由机械工业出版社出版,作者是汤姆斯·约翰,介绍了关于大数据、企业数据湖方面,格式为PDF,资源大小179.4 MB,目前在大数据类资源综合评分为:9.2分。

    企业数据湖

    企业数据湖

    内容介绍

    本书分为三个主要部分。*部分介绍了数据湖的概念、企业中数据湖泊的重要性,以及Lambda架构的*新进展。第二部分将深入研究使用Lambda架构构建数据湖的主要组件,介绍了一些流行的大数据技术,如Apache Hadoop、Spark、Sqoop、Flume和弹性搜索。第三部分以实际操作的方式展示如何实现一个企业数据湖,并介绍了几个实际的用例,而且展示了如何将其他外围组件添加到湖中以提高效率。在本书的*后,读者将能够选择正确的大数据技术,使用lambda架构模式来构建企业数据湖。

    通过阅读本书,你将:

    ·使用大数据技术构建企业级数据湖。
    ·掌握Lambda架构的精髓,以及如何在企业内使用它。
    ·学习与Apache Sqoop及其功能相关的技术细节。
    ·Kafka与Hadoop组件集成,用于获取企业数据。
    ·使用Flume进行流式数据处理。
    ·理解Flink与流式数据处理的关系。
    ·Hadoop生态圈组件的协同使用,以及它们能带来的好处。
    ·使用Elastic Stack构建快速、流式、高吞吐应用。
    ·确保数据摄取处理在不同数据格式配置时的一致性。

    目录

    • 译者序
    • 推荐序
    • 关于作者
    • 关于技术审核人员
    • 前言
    • 第一部分 概述
    • 第1章 数据导论 2
    • 第2章 数据湖概念概览 18
    • 第3章 Lambda架构:一种数据湖
    • 实现模式 36
    • 第4章 数据湖中的Lambda应用 51
    • 第二部分 数据湖的技术组件
    • 第5章 基于Apache Sqoop的批量数据获取 68
    • 第6章 基于Apache Flume的流式数据获取 108

    以上就是本次关于书籍资源的介绍和部分内容,我们还整理了以往更新的其它相关电子书资源内容,可以在下方直接下载,关于相关的资源我们在下方做了关联展示,需要的朋友们也可以参考下。


    下载地址

    下载地址:网盘下载

    学习心得

    14小时17分钟前回答

    python获取微信企业号打卡数据并生成windows计划任务

    由于公司的系统用的是Java版本,开通了企业号打卡之后又没有预算让供应商做数据对接,所以只能自己捣鼓这个,以下是个人设置的一些内容,仅供大家参考 安装python python的安装,这里就不详细写了,大家可自行度娘或google。 安装第三方库 python安装好之后别忘记配置环境变量!另外,所以的内容都是安装在服务器上的,且服务器需要能够上外网,否则,只能配置在本地,因为……

    24小时27分钟前回答

    mysql 开发技巧之JOIN 更新和数据查重/去重

    主要涉及:JOIN 、JOIN 更新、GROUP BY HAVING 数据查重/去重 1 INNER JOIN、LEFT JOIN、RIGHT JOIN、FULL JOIN(MySQL 不支持)、CROSS JOIN 这是在网上找到的非常好的一篇博文,图解 join 语句: CODING HORROR-A Visual Explanation of SQL Joins 下图可以很清楚的明白,join 的数据选取范围 [][1] [1]: http://7xs09x.com1.z0.glb.clouddn.com/160725-imooc-mysql-development-skills-notes-001.png 2 更新使用过滤条件中包括本身的表 更新 t1 t2 表中……

    19小时25分钟前回答

    使用Yii2实现主从数据库设置

    前言 MySQL主从同步是目前使用比较广泛的数据库架构,技术比较成熟,配置也不复杂,特别是对于负载比较大的网站,主从同步能够有效缓解数据库读写的压力。以前在使用yii1的时候,主从数据库的支持没有那么方便,只能写上多个DB的components,然后在AR的getDB中返回相应的db。这样也可以用来对付主从数据库 实现方法 Yii2则已经解决这个问题,直接在代码中进行处理即可: PHP代……

    欢迎发表评论:

    联系我们

    邮件联系:3522365@qq.com

    QQ联系:3522365