当前位置:首页 > 数据库 >
《颠覆大数据分析》电子书封面

颠覆大数据分析

  • 发布时间:2020年09月19日 09:01:19
  • 作者:维贾伊.阿涅斯瓦兰
  • 大小:26.3 MB
  • 类别:数据分析电子书
  • 格式:PDF
  • 版本:高清版
  • 评分:8.4

    颠覆大数据分析 PDF 高清版

      给大家带来的一篇关于数据分析相关的电子书资源,介绍了关于数据分析方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小26.3 MB,维贾伊.阿涅斯瓦兰编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.4。

      内容介绍

      《颠覆大数据分析:基于Storm、Spark等Hadoop替代技术的实时应用》每章一个主题,介绍了各种大数据分析技术与机器学习算法。本书能够让读者掌握大数据分析和机器学习的相关技术的大致脉络,为之后的进阶学习提供参考与指导。本书适合大数据技术入门者、希望对大数据技术有所了解,以及想要学习大数据技术但是不知道应该从何处入手的读者阅读。

      目录

      • 前言
      • 致谢
      • 关于作者
      • 1 引言:为什么要超越 Hadoop Map-Reduce
      • Hadoop的适用范围
      • 大数据分析之机器学习实现的革命
      • 第一代机器学习工具/范式
      • 第二代机器学习工具/范式
      • 第三代机器学习工具/范式
      • 小结
      • 参考文献
      • 2 何为伯克利数据分析栈(BDAS)
      • 实现 BDAS的动机
      • Spark:动机
      • Shark:动机
      • Mesos:动机
      • BDAS的设计及架构
      • Spark:高效的集群数据处理的范式
      • Spark的弹性分布式数据集
      • Spark的实现
      • Spark VS分布式共享内存系统
      • RDD的表达性
      • 类似 Spark的系统
      • Shark:分布式系统上的 SQL接口
      • Spark为 Shark提供的扩展
      • 列内存存储
      • 分布式数据加载
      • 完全分区智能连接
      • 分区修剪
      • 机器学习的支持
      • Mesos:集群调度及管理系统
      • Mesos组件
      • 资源分配
      • 隔离
      • 容错性
      • 小结
      • 参考文献
      • 3 使用 Spark实现机器学习算法
      • 机器学习基础知识
      • 机器学习:随机森林示例
      • 逻辑回归:概述
      • 二元形式的逻辑回归
      • 逻辑回归估计
      • 多元逻辑回归
      • Spark中的逻辑回归算法
      • 支持向量机
      • 复杂决策面
      • 支持向量机背后的数学原理
      • Spark中的支持向量机
      • Spark对 PMML的支持
      • PMML结构
      • PMML的生产者及消费者
      • Spark对朴素贝叶斯的 PMML支持
      • Spark对线性回归的PMML支持
      • 在Spark中使用MLbase进行机器学习
      • 参考文献
      • 4 实现实时的机器学习算法
      • Storm简介
      • 数据流
      • 拓扑
      • Storm集群
      • 简单的实时计算例子
      • 数据流组
      • Storm的消息处理担保
      • 基于Storm的设计模式
      • 分布式远程过程调用
      • Trident:基于Storm的实时聚合
      • 实现基于Storm的逻辑回归算法
      • 实现基于Storm的支持向量机算法
      • Storm对朴素贝叶斯PMML的支持
      • 实时分析的应用
      • 工业日志分类
      • 互联网流量过滤器
      • Storm的替代品
      • Spark流
      • D-Streams的动机
      • 参考文献
      • 5 图处理范式
      • Pregel:基于BSP的图处理框架
      • 类似的做法
      • 开源的Pregel实现
      • Giraph
      • GoldenORB
      • Phoebus
      • Apache Hama
      • Stanford GPS
      • GraphLab
      • GraphLab:多核版本
      • 分布式的GraphLab
      • PowerGraph
      • 通过 GraphLab实现网页排名算法
      • 顶点程序
      • 基于GraphLab实现随机梯度下降算法
      • 参考文献
      • 6 结论:超越Hadoop Map-Reduce的大数据分析
      • Hadoop YARN概览
      • Hadoop YARN的动机
      • 作为资源调度器的 YARN
      • YARN上的其他框架
      • 大数据分析的未来是怎样的
      • 参考文献
      • 附录 A代码笔记

      学习笔记

      CI框架数据库查询之join用法分析

      本文实例讲述了CI框架数据库查询之join用法。分享给大家供大家参考,具体如下: 用 A表中的每个ID 去查询这个 ID 在 people 表中的信息。语句如下: $this-db-from('A');$this-db-join('B', 'sites.id = B.id'); 用 A表中的每个ID 去查询这个 ID 在 B表中的信息。 注意SQL的约定,如果一个列名在二张表中是重复的,你需要在列名前加上表名和一个“."号。因此sites.id在位置桌子中意谓id所在的表是sites。在进行SQL多表查询时,最好把列名进行唯一性的标识,这样可以避免产生岐义,也可以让你自己明了。 如:你执行以下语句 $this-db-select('*');$this-db-from('blogs');$this-db-join('comments', 'comments.id = blogs.id');$query = $this-db-get(); 相当于 执……

      深入sql数据连接时的一些问题分析

      一直还不是很了解connectionstring里各个关键词的区别,累赘致死 现把一些相关领悟小小述下…… *************************************************** initial catalog与database的区别是什么 Initial Catalog ;DataBase: 两者原来其实没有任何区别只是名称不一样,就好像是人类的真实姓名与曾用名一样。。都可以叫你。 ******************************************** Integrated Security=SSPI 这个表示以当前WINDOWS系统用户身去登录SQL SERVER服务器,如果SQL SERVER服务器不支持这种方式登录时,就会出错。 你可以使用SQL SERVER的用户名和密码进行登录,如: "Provider=SQLOLEDB.1;Persist Security Info=False;Initial Catalog=数据库名;Data Source=192.168.0.1;User ID=sa;Password=密码"……

      以上就是本次介绍的数据分析电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:大话数据挖掘

      下一篇:大数据的互联网思维

      展开 +

      收起 -

      下载地址:百度网盘下载
      数据分析相关电子书
      人人都会数据分析:从生活实例学统计
      人人都会数据分析:从生活实例学统计 超清影印版

      本书系统地介绍了数据分析的统计理论基础内容,大多数知识点都列举了生活中的实用案例,帮助读者建立统计理论知识框架,形成数据分析思维逻辑,学会数据分析方法

      立即下载
      从Excel到Python:数据分析进阶指南
      从Excel到Python:数据分析进阶指南 高清版

      Excel是数据分析中最常用的工具,本书通过Python与Excel的功能对比介绍如何使用Python通过函数式编程完成Excel中的数据处理及分析工作。在Python中pandas库用于数据处理,我们从1787页的pandas官网文

      立即下载
      Spark大数据分析实战
      Spark大数据分析实战 高清版

      本书首先从技术层面讲解了Spark的机制、生态系统与开发相关的内容;然后从应用角度讲解了日志分析、推荐系统、情感分析、协同过滤、搜索引擎、社交网络分析、新闻数据分析等多个常见的

      立即下载
      Spark高级数据分析
      Spark高级数据分析 高清版

      Spark高级数据分析 是使用Spark进行大规模数据分析的实战宝典,由大数据公司Cloudera的数据科学家撰写。四位作者首先结合数据科学和大数据分析的广阔背景讲解了Spark,然后介绍了用Spark和Sc

      立即下载
      Python数据分析与数据化运营
      Python数据分析与数据化运营 扫描影印版

      这书內容从逻辑性上共分成两绝大多数,第壹一部分是相关数据统计分析类的主题风格,其次一部分是相关数字化经营的主题风格。第壹一部分的內容包含1/2/3/4章和附则,关键详细介绍了Pyt

      立即下载
      读者留言
      任浩宇

      任浩宇 提供上传

      资源
      12
      粉丝
      43
      喜欢
      97
      评论
      5

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com