当前位置:首页 > 数据库 >
《Druid实时大数据分析原理与实践》电子书封面

Druid实时大数据分析原理与实践

  • 发布时间:2019年07月06日 21:09:06
  • 作者:欧阳辰
  • 大小:48.4 MB
  • 类别:Druid电子书
  • 格式:PDF
  • 版本:高清版
  • 评分:9.1

    Druid实时大数据分析原理与实践 PDF 高清版

      给大家带来的一篇关于Druid相关的电子书资源,介绍了关于Druid、大数据、原理、实践方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小48.4 MB,欧阳辰编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.1。

      内容介绍

      Druid实时大数据分析原理与实践

      内容介绍

      Druid 做为这款开源系统的实时大数据分析软件,近期两年迅速红遍全球互联网企业,非常是针对海量信息和实时性规定高的情景,包含广告词数据统计分析、用户行为分析、数据分析、运维管理监控器剖析等,在腾迅、阿里巴巴、优酷视频、小米手机等企业常有很多取得成功运用的实例。《Druid实时大数据分析原理与实践》的目地就是说协助专业技术人员尽快深层次了解Druid 技术性、大数据分析技术性电机选型、Druid 的安裝和应用、高級特点的应用,也包含某些源码的分析,及其某些疑难问题的迅速回应。

      Druid 的食物网已经不断发展和成熟期,Druid 也已经处理很多的业务流程情景。期待这书能协助专业技术人员作出更强的技术性电机选型,深度1知道Druid 的作用和原理,更好地解决大数据分析难题。《Druid实时大数据分析原理与实践》合适大数据分析的从业者、it互联网 工作人员、互联网技术从业人员阅读文章。

      目录

      • 第1 章初识Druid . . . . . . . 1
      • 1.1 Druid 是什么1
      • 1.2 大数据分析和Druid 1
      • 1.3 Druid 的产生3
      • 1.3.1 MetaMarkets 简介3
      • 1.3.2 失败总结4
      • 1.4 Druid 的三个设计原则4
      • 1.4.1 快速查询(Fast Query) 5
      • 1.4.2 水平扩展能力(Horizontal Scalability) 5
      • 1.4.3 实时分析(Realtime Analytics) 6
      • 1.5 Druid 的技术特点6
      • 1.5.1 数据吞吐量大6
      • 1.5.2 支持流式数据摄入6
      • 1.5.3 查询灵活且快6
      • 1.5.4 社区支持力度大7
      • 1.6 Druid 的Hello World 7
      • 1.6.1 Druid 的部署环境7
      • 1.6.2 Druid 的基本概念7
      • 1.7 系统的扩展性9
      • 1.8 性能指标10
      • 1.9 Druid 的应用场景10
      • 1.9.1 国内公司11
      • 1.9.2 国外公司12
      • 1.10 小结13
      • 参考资料13
      • 第2 章数据分析及相关软件. . . .  15
      • 2.1 数据分析及相关概念15
      • 2.2 数据分析软件的发展16
      • 2.3 数据分析软件的分类17
      • 2.3.1 商业软件17
      • 2.3.2 时序数据库22
      • 2.3.3 开源分布式计算平台23
      • 2.3.4 开源分析数据库25
      • 2.3.5 SQL on Hadoop/Spark 31
      • 2.3.6 数据分析云服务33
      • 2.4 小结34
      • 参考资料34
      • 第3 章架构详解. . . . 35
      • 3.1 Druid 架构概览35
      • 3.2 Druid 架构设计思想36
      • 3.2.1 索引对树结构的选择37
      • 3.2.2 Druid 总体架构41
      • 3.2.3 基于DataSource 与Segment 的数据结构43
      • 3.3 扩展系统45
      • 3.3.1 主要的扩展45
      • 3.3.2 下载与加载扩展46
      • 3.4 实时节点47
      • 3.4.1 Segment 数据文件的制造与传播47
      • 3.4.2 高可用性与可扩展性48
      • 3.5 历史节点49
      • 3.5.1 内存为王的查询之道49
      • 3.5.2 层的分组功能50
      • 3.5.3 高可用性与可扩展性51
      • 3.6 查询节点51
      • 3.6.1 查询中枢点51
      • 3.6.2 缓存的使用52
      • 3.6.3 高可用性52
      • 3.7 协调节点53
      • 3.7.1 集群数据负载均衡的主宰53
      • 3.7.2 利用规则管理数据生命周期53
      • 3.7.3 副本实现Segment 的高可用性54
      • 3.7.4 高可用性54
      • 3.8 索引服务54
      • 3.8.1 主从结构的架构54
      • 3.8.2 统治节点55
      • 3.8.3 中间管理者与苦工56
      • 3.8.4 任务56
      • 3.9 小结57
      • 第4 章安装与配置. . . . .58
      • 4.1 安装准备58
      • 4.1.1 安装包简介58
      • 4.1.2 安装环境59
      • 4.1.3 Druid 外部依赖60
      • 4.2 简单示例61
      • 4.2.1 服务运行61
      • 4.2.2 数据导入与查询62
      • 4.3 规划与部署65
      • 4.4 基本配置68
      • 4.4.1 基础依赖配置68
      • 4.4.2 数据节点配置调优69
      • 4.4.3 查询节点配置调优69
      • 4.5 集群节点配置示例70
      • 4.5.1 节点规划70
      • 4.5.2 Master 机器配置72
      • 4.5.3 Data 机器配置76
      • 4.6 小结79
      • 第5 章数据摄入. . . . 80
      • 5.1 数据摄入的两种方式80
      • 5.1.1 流式数据源80
      • 5.1.2 静态数据源81
      • 5.2 流式数据摄取81
      • 5.2.1 以Pull 方式摄取82
      • 5.2.2 用户行为数据摄取案例86
      • 5.2.3 以Push 方式摄取89
      • 5.2.4 索引服务任务相关管理接口91
      • 5.3 静态数据批量摄取94
      • 5.3.1 以索引服务方式摄取94
      • 5.3.2 以Hadoop 方式摄取96
      • 5.4 流式与批量数据摄取的结合99
      • 5.4.1 Lambda 架构99
      • 5.4.2 解决时间窗口问题100
      • 5.5 数据摄取的其他重要知识101
      • 5.5.1 数据分片101
      • 5.5.2 数据复制106
      • 5.5.3 索引服务之Tranquility 107
      • 5.5.4 高基数维度优化111
      • 5.6 小结116
      • 第6 章数据查询. . . . 117
      • 6.1 查询过程117
      • 6.2 组件118
      • 6.2.1 Filter 118
      • 6.2.2 Aggregator 121
      • 6.2.3 Post-Aggregator 125
      • 6.2.4 Search Query 129
      • 6.2.5 Interval 129
      • 6.2.6 Context 130
      • 6.3 案例介绍131
      • 6.4 Timeseries 134
      • 6.5 TopN 138
      • 6.6 GroupBy 144
      • 6.7 Select 149
      • 6.8 Search 151
      • 6.9 元数据查询153
      • 6.10 小结156
      • 第7 章高级功能和特性. . . . 157
      • 7.1 近似直方图(Approximate Histogram) 158
      • 7.1.1 分位数和直方图158
      • 7.1.2 实现原理158
      • 7.1.3 如何使用161
      • 7.1.4 近似直方图小结163
      • 7.2 数据Sketch 163
      • 7.2.1 DataSketch Aggregator 163
      • 7.2.2 DataSketch Post-Aggregator 167
      • 7.3 地理查询(Geographic Query) 170
      • 7.3.1 基本原理170
      • 7.3.2 空间索引(Spatial Indexing) 171
      • 7.3.3 空间过滤(Spatial Filter) 171
      • 7.3.4 边界条件(Boundary Condition) 172
      • 7.3.5 地理查询小结172
      • 7.4 Router 172
      • 7.4.1 Router 概览172
      • 7.4.2 路由规则174
      • 7.4.3 配置175
      • 7.4.4 路由策略175
      • 7.5 Kaa 索引服务177
      • 7.5.1 设计背景177
      • 7.5.2 实现178
      • 7.5.3 如何使用182
      • 7.6 Supervisor API 186
      • 7.6.1 创建Supervisor 186
      • 7.6.2 关闭Supervisor 186
      • 7.6.3 获取当前执行的Supervisor 186
      • 7.6.4 获取Supervisor 规范186
      • 7.6.5 获取Supervisor 的状态报告186
      • 7.6.6 获取所有Supervisor 的历史187
      • 7.6.7 获取Supervisor 的历史187
      • 7.7 最佳实践187
      • 7.7.1 容量规划187
      • 7.7.2 Supervisor 的持久化187
      • 7.7.3 Schema 的配置与变更188
      • 7.8 小结188
      • 第8 章核心源代码探析. . . .  189
      • 8.1 如何编译Druid 代码189
      • 8.2 Druid 项目介绍190
      • 8.3 索引结构模块和层次关系192
      • 8.4 Column 结构192
      • 8.5 Segment 195
      • 8.6 Query 模块203
      • 8.6.1 基础组件203
      • 8.6.2 内存池管理206
      • 8.6.3 查询流程概览207
      • 8.6.4 查询引擎225
      • 8.7 Coordinator 模块229
      • 8.8 小结237
      • 第9 章监控和安全. . . . 238
      • 9.1 Druid 监控238
      • 9.1.1 Druid 监控指标238
      • 9.1.2 常用的监控方法245
      • 9.2 Druid 告警250
      • 9.2.1 Druid 告警信息250
      • 9.2.2 Druid 与告警系统的集成250
      • 9.3 Druid 安全251
      • 9.3.1 Druid 与利用Kerberos 加强安全认证的系统集成251
      • 9.3.2 集成外部权限模块完成用户授权255
      • 9.4 小结256
      • 第10 章实践和应用. . . .257
      • 10.1 小米257
      • 10.1.1 场景一:小米统计服务258
      • 10.1.2 场景二:广告平台实时数据分析260
      • 10.2 优酷土豆262
      • 10.2.1 需求分析262
      • 10.2.2 技术选型及工程实践263
      • 10.2.3 优化策略266
      • 10.3 腾讯267
      • 10.3.1 工程实践267
      • 10.3.2 业务实践270
      • 10.4 蓝海讯通279
      • 10.5 小结284
      • 第11 章Druid 生态与展望. . . .  285
      • 11.1 Druid 生态系统285
      • 11.2 Druid 生态系统资源288
      • 11.2.1 IAP 288
      • 11.2.2 Plywood 289
      • 11.2.3 PlyQL 294
      • 11.2.4 Pivot 297
      • 11.2.5 Druid-Metrics-Kaa 300
      • 11.2.6 Caravel(Airbnb) 301
      • 11.3 Druid 的社区讨论组302
      • 11.4 Druid 展望302
      • 参考资料303
      • 附录A 常见问题(FAQ) 304
      • 附录B 常用参数表 312

      学习笔记

      SpringBoot入门之集成Druid的方法示例

      Druid:为监控而生的数据库连接池.这篇先了解下它的简单使用,下篇尝试用它做多数据源配置。 主要参考:https://github.com/alibaba/druid/wiki/ 常见问题https://github.com/alibaba/druid/tree/master/druid-spring-boot-starter 一、引入依赖 这里看其他博客都是引用的Druid,由于是使用springboot集成,这里参考druid官方文档,用的是druid-spring-boot-starter。 dependency groupIdcom.alibaba/groupId artifactIddruid-spring-boot-starter/artifactId version1.1.10/version /dependency 二、设置属性 这里用的demo还是在上一博客基础上进行的修改,所以已经配置上了数据库连接和mybatis。 spring.mvc.view.prefix=/view/spring.mvc.view.suffix=.jspmybatis.type-aliases-package=com.example.modelmybatis.config-locat……

      springboot 动态数据源的实现方法(Mybatis+Druid)

      Spring多数据源实现的方式大概有2中,一种是新建多个MapperScan扫描不同包,另外一种则是通过继承AbstractRoutingDataSource实现动态路由。今天作者主要基于后者做的实现,且方式1的实现比较简单这里不做过多探讨。 实现方式 方式1的实现(核心代码): @Configuration@MapperScan(basePackages = "com.goofly.test1", sqlSessionTemplateRef = "test1SqlSessionTemplate")public class DataSource1Config1 { @Bean(name = "dataSource1") @ConfigurationProperties(prefix = "spring.datasource.test1") @Primary public DataSource testDataSource() { return DataSourceBuilder.create().build(); } // .....略}@Configuration@MapperScan(basePackages = "com.goofly.test2", sqlSessionTemplateRef = "test1SqlSessionTemplate")public class DataSource……

      spring boot配置druid连接池的完整步骤

      Druid的简介 Druid首先是一个数据库连接池。Druid是目前最好的数据库连接池,在功能、性能、扩展性方面,都超过其他数据库连接池,包括DBCP、C3P0、BoneCP、Proxool、JBoss DataSource。Druid已经在阿里巴巴部署了超过600个应用,经过一年多生产环境大规模部署的严苛考验。Druid是阿里巴巴开发的号称为监控而生的数据库连接池! Druid的功能 1、替换DBCP和C3P0。Druid提供了一个高效、功能强大、可扩展性好的数据库连接池。 2、可以监控数据库访问性能,Druid内置提供了一个功能强大的StatFilter插件,能够详细统计SQL的执行性能,这对于线上分析数据库访问性能有帮助。 3、数据库密码加密。直接把数据库密码写在配……

      springboot配置druid连接池的方法示例

      Druid的简介 Druid首先是一个数据库连接池。Druid是目前最好的数据库连接池,在功能、性能、扩展性方面,都超过其他数据库连接池,包括DBCP、C3P0、BoneCP、Proxool、JBoss DataSource。Druid已经在阿里巴巴部署了超过600个应用,经过一年多生产环境大规模部署的严苛考验。Druid是阿里巴巴开发的号称为监控而生的数据库连接池! Druid的功能 1、替换DBCP和C3P0。Druid提供了一个高效、功能强大、可扩展性好的数据库连接池。 2、可以监控数据库访问性能,Druid内置提供了一个功能强大的StatFilter插件,能够详细统计SQL的执行性能,这对于线上分析数据库访问性能有帮助。 3、数据库密码加密。直接把数据库密码写在配……

      以上就是本次介绍的Druid电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:Clojure编程乐趣

      下一篇:深度剖析Hadoop HDFS

      展开 +

      收起 -

      • 《Druid实时大数据分析原理与实践》PDF下载

      下载地址:百度网盘下载
      Druid相关电子书
      基于Hadoop与Spark的大数据开发实战
      基于Hadoop与Spark的大数据开发实战 原书影印版

      1、选取知识点核心实用,以互联网 实现终身学习 2、以企业需求为设计导向,以任务驱动为讲解方式 3、以案例为主线组织知识点,以实战项目来提升技术 4、充分考虑学习者的认知曲线,由浅入深,边讲边练

      立即下载
      Python和HDF5大数据应用
      Python和HDF5大数据应用 高质量中文版

      本书向任何有Python数据分析基本背景的人介绍如何在Python下使用HDF5。适合有基础的Python开发者,尤其适合要使用Python开发数据存储和处理等相关应用的读者阅读参考,感兴趣的小伙伴们可以下载参考一下

      立即下载
      数据不说谎:大数据之下的世界
      数据不说谎:大数据之下的世界 原书扫描版

      专业数据分析团队“城市数据团”全新力作,“团支书”结合社会热点,用大数据和数据挖掘分析数据背后的故事。趣味性强,语言幽默,知识丰富,教会读者用大数据做出正确的判断。

      立即下载
      实时大数据分析
      实时大数据分析 原书影印版

      本书详细阐述了实时大数据分析的实现过程,主要包括大数据技术前景及分析平台,感兴趣的可以下载学习

      立即下载
      大数据之路:阿里巴巴大数据实践
      大数据之路:阿里巴巴大数据实践 影印版

      阿里巴巴官方首度公开大数据系统架构与技术细节,CSDN、ChinaUnix、ITPUB、segmentfault等多家技术社区力荐

      立即下载
      Spark与Hadoop大数据分析
      Spark与Hadoop大数据分析 超清影印版

      这本书系统讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,配套详细的实现示例,是快速掌握大数据分析基础架构及其实施方法的详实参考

      立即下载
      大数据搜索引擎原理分析及编程实现
      大数据搜索引擎原理分析及编程实现 原书完整版

      本书向读者提供了一套完整的大数据时代背景下的搜索引擎解决方案,详尽地介绍了搜索引擎的技术架构、算法体系及取得的效果,以模块化的方式进行组织

      立即下载
      读者留言
      众商

      众商 提供上传

      资源
      19
      粉丝
      43
      喜欢
      243
      评论
      1

      Copyright 2018-2020 www.xz577.com 码农之家

      投诉 / 推广 / 赞助:QQ:520161757