当前位置:首页 > 数据库 >
《基于Apache Kylin 构建大数据分析平台》电子书封面

基于Apache Kylin 构建大数据分析平台

  • 发布时间:2020年05月08日 09:48:37
  • 作者:蒋守壮
  • 大小:89.9 MB
  • 类别:大数据电子书
  • 格式:PDF
  • 版本:原书扫描版
  • 评分:7.1

    基于Apache Kylin 构建大数据分析平台 PDF 原书扫描版

      给大家带来的一篇关于大数据相关的电子书资源,介绍了关于Apache、Kylin、大数据分析方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小89.9 MB,蒋守壮编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.8。

      内容介绍

      Apache Kylin是一个开源系统的分布式系统剖析模块,出示Hadoop之中的SQL查寻插口及多维分析(OLAP)能力以适用集成电路工艺数据信息,最开始由eBay企业开发设计并奉献至开源社区。它能在亚秒内查寻极大的Hive表。

      这书分成21章,详尽解读ApacheKylin定义、安裝、配备、布署,让读者对ApacheKylin搭建大数据分析服务平台有一个感性认识。另外,这书从运用视角,融合Dome和案例详细介绍了用于多维分析的Cube优化算法的建立、配备与提升。最终还详细介绍了Kyligence企业公布KAP大数据分析服务平台,对读者有巨大的实用价值。
      这书合适云计算技术新手、大数据分析工作人员、大数据架构师等,也合适用于高等学校和培训机构有关技术专业老师学生课堂教学参照。

      目录

      • 第一部分 Apache Kylin基础部分
      • 第1章 Apache Kylin前世今生 3
      • 1.1 Apache Kylin的背景 3
      • 1.2 Apache Kylin的应用场景 3
      • 1.3 Apache Kylin的发展历程 4
      • 第2章 Apache Kylin前奏 7
      • 2.1 事实表和维表 7
      • 2.2 星型模型和雪花型模型 7
      • 2.2.1 星型模型 7
      • 2.2.2 雪花型模型 8
      • 2.2.3 星型模型示例 8
      • 2.3 OLAP 9
      • 2.3.1 OLAP分类 9
      • 2.3.2 OLAP的基本操作 10
      • 2.4 数据立方体(Data Cube) 11
      • 第3章 Apache Kylin 工作原理和体系架构 12
      • 3.1 Kylin工作原理 12
      • 3.2 Kylin体系架构 13
      • 3.3 Kylin中的核心部分:Cube构建 15
      • 3.4 Kylin的SQL查询 16
      • 3.5 Kylin的特性和生态圈 16
      • 第4章 搭建CDH大数据平台 18
      • 4.1 系统环境和安装包 19
      • 4.1.1 系统环境 19
      • 4.1.2 安装包的下载 20
      • 4.2 准备工作:系统环境搭建 21
      • 4.2.1 网络配置(CDH集群所有节点) 21
      • 4.2.2 打通SSH,设置ssh无密码登录(所有节点) 21
      • 4.3 正式安装CDH:准备工作 29
      • 4.4 正式安装CDH5:安装配置 30
      • 4.4.1 CDH5的安装配置 30
      • 4.4.2 对Hive、HBase执行简单操作 39
      • 第5章 使用Kylin构建企业大数据分析平台的4种部署方式 41
      • 5.1 Kylin部署的架构 41
      • 5.2 Kylin的四种典型部署方式 42
      • 第6章 单独为Kylin部署HBase集群 44
      • 第7章 部署Kylin集群环境 58
      • 7.1 部署Kylin的先决条件 58
      • 7.2 部署Kylin集群环境 61
      • 7.3 为Kylin集群搭建负载均衡器 70
      • 7.3.1 搭建Nginx环境 70
      • 7.3.2 配置Nginx实现Kylin的负载均衡 73
      • 第二部分 Apache Kylin 进阶部分
      • 第8章 Demo案例实战 77
      • 8.1 Sample Cube案例描述 77
      • 8.2 Sample Cube案例实战 78
      • 8.2.1 准备数据 78
      • 8.2.2 构建Cube 81
      • 第9章 多维分析的Cube创建实战 89
      • 9.1 Cube模型 89
      • 9.2 创建Cube的流程 90
      • 9.2.1 步骤一:Hive中事实表,以及多张维表的处理 90
      • 9.2.2 步骤二:Kylin中建立项目(Project) 95
      • 9.2.3 步骤三:Kylin中建立数据源(Data Source) 95
      • 9.2.4 步骤四:Kylin中建立数据模型(Model) 98
      • 9.2.5 步骤五:Kylin中建立Cube 104
      • 9.2.6 步骤六:Build Cube 114
      • 9.2.7 步骤七:查询Cube 118
      • 第10章 Build Cube的来龙去脉 120
      • 10.1 流程分析 120
      • 10.2 小结 134
      • 第三部分 Apache Kylin 高级部分
      • 第11章 Cube优化 137
      • 第12章 备份Kylin的Metadata 142
      • 12.1 Kylin的元数据 142
      • 12.2 备份元数据 143
      • 12.3 恢复元数据 146
      • 第13章 使用Hive视图 147
      • 13.1 使用Hive视图 147
      • 13.2 使用视图实战 149
      • 第14章 Kylin的垃圾清理 153
      • 14.1 清理元数据 153
      • 14.2 清理存储器数据 154
      • 第15章 JDBC访问方式 157
      • 第16章 通过RESTful访问Kylin 161
      • 第17章 Kylin版本之间升级 179
      • 17.1 从1.5.2升级到最新版本1.5.3 179
      • 17.2 从1.5.1升级到1.5.2版本 180
      • 17.3 从Kylin 1.5.2.1升级到Kylin 1.5.3实战 181
      • 17.4 补充内容 187
      • 第18章 大数据可视化实践 189
      • 18.1 可视化工具简述 189
      • 18.2 安装Kylin ODBC驱动 190
      • 18.3 通过Excel访问Kylin 192
      • 18.4 通过Power BI访问Kylin 194
      • 18.4.1 安装配置Power BI 194
      • 18.4.2 实战操作 198
      • 18.5 通过Tableau访问Kylin 199
      • 18.6 Kylin + Mondrian + Saiku 205
      • 18.7 实战演练:通过Saiku访问Kylin 211
      • 18.7.1 第一个Schema例子:myproject_pvuv_cube的演示 211
      • 18.7.2 第二个Schema例子:kylin_sales_cube的演示 219
      • 18.7.3 Saiku使用的一些问题 223
      • 18.8 通过Apache Zepplin访问Kylin 229
      • 18.9 通过Kylin的“Insight”查询 232
      • 第19章 使用Streaming Table 构建准实时Cube 236
      • 第20章 快速数据立方算法 251
      • 20.1 快速数据立方算法概述 251
      • 20.2 快速数据立方算法优点和缺点 253
      • 20.3 获取Fast Cubing算法的优势 254
      • 第四部分 Apache Kylin的扩展部分
      • 第21章 大数据智能分析平台KAP 257
      • 21.1 大数据智能分析平台KAP概述 257
      • 21.2 KAP的安装部署 259

      学习笔记

      PHP+Apache实现二级域名之间共享cookie的方法

      本文实例讲述了PHP+Apache实现二级域名之间共享cookie的方法。分享给大家供大家参考,具体如下: 简介 login.koastal.com设置domain为koastal.com,则www.koastal.com即可访问该cookie。 也就是说二级域名(或者三级域名)之间可以通过这种方式共享cookie。 其实cookie的domain属性的用法跟path有些类似,比如我们将cookie的path设置为/,则/user目录下也可以访问该cookie。 实践 Apache同一端口对应不同域名 httpd-vhosts.conf VirtualHost 127.0.0.1:80 ServerName koastal.com ServerAlias www.koastal.com DocumentRoot D:\wamp64\vhosts\www Directory "D:\wamp64\vhosts\www" Options +Indexes +Includes +FollowSymLinks +MultiViews AllowOverride All Require local /Directory/VirtualHostVirtualHost 127.0.0.1:80……

      php apache开启跨域模式过程详解

      apaceh 配置: VirtualHost *:80 ServerAdmin xxx@qq.com DocumentRoot "C:/htdocs/demo" ServerName dev.dd.cn ##ErrorLog "logs/dummy-host.localhost-error.log" ##CustomLog "logs/dummy-host.localhost-access.log" combined Directory "C:/htdocs/demo" #Require all denied Header set Access-Control-Allow-Origin * /Directory/VirtualHost PHP文件设置: ?php header("Access-Control-Allow-Origin:*"); //处理请求输出数据? 配置的含义是允许任何域发起的请求都可以获取当前服务器的数据。当然,这样有很大的危险性,恶意站点可能通过XSS攻击我们的服务器。所以我们应该尽量有针对性的对限制安全的来源,例如下面的设置使得只有http://feng.com这个域才能跨域访问服务器的API。 httpd.conf: VirtualHost *:80 Serve……

      Apache Commons Math3探索之快速傅立叶变换代码示例

      上一篇文章中我们了解了Apache Commons Math3探索之多项式曲线拟合实现代码,今天我们就来看看如何通过apache commons math3实现快速傅里叶变换,下面是具体内容。 傅立叶变换:org.apache.commons.math3.transform.FastFourierTransformer类。 用法示例代码: double inputData = new double[arrayLength]; // ... 给inputData赋值 FastFourierTransformer fft = new FastFourierTransformer(DftNormalization.STANDARD); Complex[] result = fft.transform(inputData, TransformType.FORWARD); 使用还是非常简单的。首先要创建待计算数据的数组,可以是double类型,亦可是org.apache.commons.math3.complex.Complex类型,然后创建org.apache.commons.math3.transform.FastFourierTransformer对象实例,最后调用其transform方法……

      Windows2003下php5.4安装配置教程(Apache2.4)

      直接配置php一直使用如同《【php】本地开发环境的部署与helloworld》的一键傻瓜包,被批为极度不专业,关键是这些一键傻瓜包LAMP的版本不好控制,端口什么的也不好调。曾经在Linux系统下自己配置过LAMP的php环境,详见《Ubuntu下LAMP环境配置教程(linux)》(点击打开链接)与《Ubuntu下图形化LAMP环境配置教程(linux)》(点击打开链接),但由于各种原因,在Windows2003系统下如何一步一步地搞出php的环境,一直没有好好研究一下。其实根本就一点都不难,就比那Tomcat难一点而已,比那IIS+Asp.net简单得多。 一、Apache2.4与php5.4的下载 由于php宣布自php5.5之后无法支持Winxp内核的系统,因此在Windows2003服务系统下只能去……

      Python(Django)项目与Apache的管理交互的方法

      准备:Django的环境(Python)、Apache、Wsgi(必须文件) 首先需要电脑有Python基础下并且安装好Django的环境,下载Apache文件和Wsgi文件。 Apache HTTP Server for Windows V2.4.33 vc14 (32/64) 官方正式本地版下载地址 如果两个文件都未能成功下载,可加QQ群607021567,直接找我要! 接下来开始操作两个文件夹。 (一)Apache文件夹: 1、将下载好的mod_wsgi.so文件放入 apache/modules文件夹下。 2、编辑文件 conf/httpd.conf文件(记事本方式),下载好的这个文件内的所有有关路径指向的都是C盘,所以都修改为你apache文件所放到的文件夹下,基本只修改盘符! 3、在同上文件夹下有一个extra的文件夹,在文件夹下编辑httpd-vhosts.conf文件(……

      以上就是本次介绍的大数据电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:2018阿里技术参考图册:算法篇+研发篇

      下一篇:ECMAScript 2018快速入门

      展开 +

      收起 -

      • 《基于Apache Kylin 构建大数据分析平台》PDF下载

      大数据相关电子书
      Hadoop大数据平台构建与应用
      Hadoop大数据平台构建与应用 完整影印版

      具有较强的实用性和可操作性,语言精练,通俗易懂,操作步骤描述详尽,并配有大量操作图例,感兴趣的可以下载学习

      立即下载
      企业级大数据平台构建:架构与实现
      企业级大数据平台构建:架构与实现 完整影印版

      完整的介绍了构建一个真实可用、安全可靠的企业级大数据平台所需要运用的知识体系,及构建的具体步骤和方法,手把手教你如何拉通Hadoop体系技术栈,欢迎下载

      立即下载
      自己动手做大数据系统
      自己动手做大数据系统 高清版

      如果你是一位在校大学生,对大数据感兴趣,也知道使用的企业越来越多,市场需求更是日新月异,但苦于自己基础不够,心有余而力不足;也看过不少大数据方面的书籍、博客、视频等,但

      立即下载
      大数据处理之道
      大数据处理之道 扫描版 立即下载
      征信与大数据
      征信与大数据 完整影印版

      本书剖析国外成熟的知名征信机构的发展历程,商业模式和未来趋势,提取对中国征信业建设的启示和有益的经验,希望能够给混乱而有蓬勃发展的中国市场化征信提供借鉴,感兴趣的可以下载

      立即下载
      Spark:大数据集群计算的生产实践
      Spark:大数据集群计算的生产实践 完整超清版

      这书对于spark从认证性自然环境迁移到实际上生产环境时候碰到的各种各样难题得出了实际上的协助,包含了开发设计及维护保养生产级Spark运用的各种各样方式 、组件与有用实践活动。本书分

      立即下载
      大数据技术原理与应用
      大数据技术原理与应用 扫描第2版

      内容简介 (1) 概念篇:介绍当前紧密关联的IT领域技术云计算、大数据和物联网。 (2) 大数据存储与管理篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据

      立即下载
      Spark大数据分析:核心概念、技术及实践
      Spark大数据分析:核心概念、技术及实践 高清版

      Spark大数据分析:核心概念、技术及实践 是关于大数据和Spark的一个简明手册。它将助你学习如何用Spark来完成很多大数据分析任务,其中覆盖了高效利用Spark所需要知道的重要主题:如何使用

      立即下载
      电子商务数据分析:大数据营销数据化运营流量转化(第2版)
      电子商务数据分析:大数据营销数据化运营流量转化(第2版)

      本书主要从电子商务的数据分析入手,系统介绍在电子商务环境下进行数据分析的各种思路和方法。全书共分为12章,主要内容包括电商运营与数据分析、使用数据分析工具、利用市场数据选择商品、竞争对手数据分析、商品定价分析、流量数据分析、运营与销售数据分析、库存数据分析、会员数据分析、利润数据分析、数据商业报告的制作等。最后一章还以综合案例的形式进一步介绍了网店数据分析的综合运用。

      立即下载
      Cloudera Hadoop大数据平台实战指南
      Cloudera Hadoop大数据平台实战指南 扫描版

      对于入门和学习大数据技术的读者来说,大数据技术的生态圈和知识体系过于庞大,可能还没有开始学习就已经陷入众多的陌生名词和泛泛的概念中。

      立即下载
      读者留言
      吴思远

      吴思远 提供上传

      资源
      46
      粉丝
      43
      喜欢
      87
      评论
      17

      Copyright 2018-2020 xz577.com 码农之家

      本站所有电子书资源不再提供下载地址,只分享来路

      版权投诉 / 书籍推广 / 赞助:QQ:520161757