当前位置:首页 > 数据库 >
《架构大数据:大数据技术及算法解析》电子书封面

架构大数据:大数据技术及算法解析

  • 发布时间:2020年05月07日 09:21:47
  • 作者:赵勇
  • 大小:194.7 MB
  • 类别:大数据电子书
  • 格式:PDF
  • 版本:影印完整版
  • 评分:9.2

    架构大数据:大数据技术及算法解析 PDF 影印完整版

      给大家带来的一篇关于大数据相关的电子书资源,介绍了关于大数据、大数据技术、算法方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小194.7 MB,赵勇编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.5。

      内容介绍

      这书从大数据架构的视角全面解析大数据技术性及算法,讨论大数据的发展趋势和发展趋势。不但对大数据有关技术性及算法干了针对性的剖析和叙述,整理了大数据的技术性归类,如系统架构适用、大数据采集、大数据存储、大数据解决、大数据展现及互动,还结合了大数据制造行业的*技术展和大中型互联网企业的大数据架构实践活动,勤奋为阅读者出示一个大数据的全景图画轴。这书从大数据架构的视角全面解析大数据技术性及算法,讨论大数据的发展趋势和发展趋势。不但对大数据有关技术性及算法干了针对性的剖析和叙述,整理了大数据的技术性归类,如系统架构适用、大数据采集、大数据存储、大数据解决、大数据展现及互动,还结合了大数据制造行业的*技术展和大中型互联网企业的大数据架构实践活动,勤奋为阅读者出示一个大数据的全景图画轴。

      这书从大数据架构的视角全面解析大数据技术性及算法,讨论大数据的发展趋势和发展趋势,全方位详细介绍大数据的有关技术性、算法和应用领域,协助阅读者塑造大数据的技术选型和系统架构图工作能力。

      目录

      • 内容简介
      • 前言
      • 第1章 大数据技术概述
      • 1.1 大数据的概念
      • 1.2 大数据的行业价值
      • 1.3 大数据问题的爆发
      • 1.4 大数据处理流程
      • 1.5 大数据技术
      • 1.5.1 基础架构支持
      • 1.5.2 数据采集
      • 1.5.3 数据存储
      • 1.5.4 数据计算
      • 1.5.5 展现与交互
      • 1.6 练习题
      • 参考文献
      • 第2章 大数据基础支撑——数据中心及云计算
      • 2.1 数据中心概述
      • 2.1.1 云计算时代数据中心面临的问题
      • 2.1.2 新一代数据中心关键技术
      • 2.1.3 业界发展动态
      • 2.1.4 小结
      • 2.2 云计算简介
      • 2.2.1 云计算定义
      • 2.2.2 云计算主要特征
      • 2.2.3 Web服务、网格和云计算
      • 2.2.4 云计算应用分类
      • 2.2.5 小结
      • 2.3 大数据与云计算的关系
      • 2.3.1 大数据是信息技术发展的必然阶段
      • 2.3.2 云计算等新兴信息技术正在真正地落地和实施
      • 2.3.3 云计算等新兴技术是解决大数据问题的核心关键
      • 2.4 云资源调度与管理
      • 2.4.1 云资源管理
      • 2.4.2 云资源调度策略
      • 2.4.3 云计算数据中心负载均衡调度
      • 2.5 开源云管理平台OpenStack
      • 2.5.1 OpenStack的构成
      • 2.5.2 OpenStack各组件之间的关系
      • 2.5.3 OpenStack的逻辑架构
      • 2.5.4 小结
      • 2.6 软件定义网络
      • 2.6.1 起源与发展
      • 2.6.2 OpenFlow标准和规范
      • 2.6.3 OpenFlow的应用
      • 2.7 虚拟机与容器
      • 2.7.1 VM虚拟化与Container虚拟化
      • 2.7.2 Docker
      • 2.8 练习题
      • 参考文献
      • 第3章 云计算先行者——Google的三驾马车
      • 3.1 Google的三驾马车
      • 3.1.1 GFS——一个可扩展的分布式文件系统
      • 3.1.2 MapReduce——一种并行计算的编程模型
      • 3.1.3 BigTable——一个分布式数据存储系统
      • 3.2 Google新“三驾马车”
      • 3.2.1 Caffeine——基于Percolator的搜索索引系统
      • 3.2.2 Pregel——高效的分布式图计算的计算框架
      • 3.2.3 Dremel——大规模数据的交互式数据分析系统
      • 3.3 练习题
      • 参考文献
      • 第4章 云存储系统
      • 4.1 云存储的基本概念
      • 4.1.1 云存储结构模型
      • 4.1.2 云存储与传统存储系统的区别
      • 4.2 云存储关键技术
      • 4.2.1 存储虚拟化技术
      • 4.2.2 分布式存储技术
      • 4.3 云存储系统分类
      • 4.3.1 分布式文件存储
      • 4.3.2 分布式块存储
      • 4.3.3 分布式对象存储
      • 4.3.4 统一存储
      • 4.4 其他相关技术
      • 4.5 练习题
      • 参考文献
      • 第5章 数据采集系统
      • 5.1 Flume
      • 5.1.1 Flume架构
      • 5.1.2 Flume核心组件
      • 5.1.3 Flume环境搭建与部署
      • 5.2 Scribe
      • 5.2.1 Scribe架构
      • 5.2.2 Scribe中的Store
      • 5.2.3 Scribe环境搭建与部署
      • 5.3 Chukwa
      • 5.3.1 Chukwa的设计目标
      • 5.3.2 Chukwa架构
      • 5.3.3 Chukwa环境搭建与部署
      • 5.4 Kafka
      • 5.4.1 Kafka架构
      • 5.4.2 Kafka存储
      • 5.4.3 Kafka的特点
      • 5.4.4 Kafka环境搭建与部署
      • 5.5 练习题
      • 参考文献
      • 第6章 Hadoop与MapReduce
      • 6.1 Hadoop平台
      • 6.1.1 Hadoop概述
      • 6.1.2 Hadoop的发展简史
      • 6.1.3 Hadoop的功能和作用
      • 6.1.4 HDFS
      • 6.1.5 HBase
      • 6.2 MapReduce
      • 6.2.1 第一代MapReduce(MRv1)
      • 6.2.2 MapReduce 2.0——Yarn
      • 6.3 Hadoop相关生态系统
      • 6.3.1 交互式数据查询分析
      • 6.3.2 数据收集、转换工具
      • 6.3.3 机器学习工具
      • 6.3.4 集群管理与监控
      • 6.3.5 其他工具
      • 6.4 Hadoop应用案例
      • 6.5 练习题
      • 参考文献
      • 第7章 Spark——大数据统一计算平台
      • 7.1 Spark简介
      • 7.1.1 Spark
      • 7.1.2 BDAS
      • 7.2 RDD
      • 7.2.1 RDD基本概念
      • 7.2.2 RDD示例
      • 7.2.3 RDD与分布式共享内存
      • 7.3 Spark SQL
      • 7.4 MLlib
      • 7.5 GraphX
      • 7.6 Spark Streaming
      • 7.6.1 基本概念
      • 7.6.2 编程模型
      • 7.7 Spark的安装
      • 7.7.1 单机运行Spark
      • 7.7.2 使用Spark Shell与Spark交互
      • 7.8 Shark、Impala、Hive对比
      • 7.9 练习题
      • 参考文献
      • 第8章 Storm流计算系统
      • 8.1 流计算系统
      • 8.1.1 流计算系统的特点
      • 8.1.2 流计算处理基本流程
      • 8.2 Storm流计算框架
      • 8.2.1 Storm简介
      • 8.2.2 Storm关键术语
      • 8.2.3 Storm架构设计
      • 8.3 Storm编程实例
      • 8.4 Storm应用
      • 8.4.1 Storm应用场景
      • 8.4.2 Storm应用实例
      • 8.5 其他流计算框架
      • 8.6 练习题
      • 参考文献
      • 第9章 SQL、NoSQL与NewSQL
      • 9.1 传统SQL数据库
      • 9.1.1 关系模型
      • 9.1.2 关系型数据库的优点
      • 9.1.3 关系型数据库面临的问题
      • 9.2 NoSQL
      • 9.2.1 NoSQL与大数据
      • 9.2.2 NoSQL理论基础
      • 9.2.3 分布式模型
      • 9.2.4 NoSQL数据库分类
      • 9.3 NewSQL
      • 9.3.1 系统分类
      • 9.3.2 Google Spanner
      • 9.3.3 MemSQL
      • 9.3.4 VoltDB
      • 9.4 练习题
      • 参考文献
      • 第10章 大数据与数据挖掘
      • 10.1 数据挖掘的主要功能和常用算法
      • 10.1.1 数据挖掘的主要功能
      • 10.1.2 常用算法
      • 10.2 大数据时代的数据挖掘
      • 10.2.1 传统数据挖掘解决方案
      • 10.2.2 分布式数据挖掘解决方案
      • 10.3 数据挖掘相关工具
      • 10.3.1 Mahout
      • 10.3.2 语言工具——Python
      • 10.4 数据挖掘与R语言
      • 10.4.1 R语言简介
      • 10.4.2 R语言在数据挖掘上的应用
      • 10.5 练习题
      • 参考文献
      • 第11章 深度学习
      • 11.1 深度学习介绍
      • 11.1.1 深度学习的概念
      • 11.1.2 深度学习的结构
      • 11.1.3 从机器学习到深度学习
      • 11.2 深度学习基本方法
      • 11.2.1 自动编码器
      • 11.2.2 稀疏编码
      • 11.3 深度学习模型
      • 11.3.1 深度置信网络
      • 11.3.2 卷积神经网络
      • 11.4 深度学习的训练加速
      • 11.4.1 GPU加速
      • 11.4.2 数据并行
      • 11.4.3 模型并行
      • 11.4.4 计算集群
      • 11.5 深度学习应用
      • 11.5.1 Google
      • 11.5.2 百度
      • 11.5.3 腾讯Mariana
      • 11.6 练习题
      • 参考文献
      • 第12章 电子商务与社会化网络大数据分析
      • 12.1 推荐系统简介
      • 12.1.1 推荐系统的评判标准
      • 12.1.2 推荐系统的分类
      • 12.1.3 在线推荐系统常用算法介绍
      • 12.1.4 相关算法知识
      • 12.2 计算广告
      • 12.2.1 计算广告简介
      • 12.2.2 计算广告发展阶段
      • 12.2.3 计算广告相关算法
      • 12.2.4 计算广告与大数据
      • 12.2.5 大数据在计算广告中的应用案例
      • 12.3 社交网络
      • 12.3.1 社交网络中大数据挖掘的应用场景
      • 12.3.2 社交网络大数据挖掘核心算法模型
      • 12.3.3 图计算框架
      • 12.3.4 大数据在社交网络中的应用案例
      • 12.4 练习题
      • 第13章 大数据展示与交互技术
      • 13.1 数据可视化分类
      • 13.1.1 按照展示内容进行划分
      • 13.1.2 按照数据类型进行划分
      • 13.2 可视化技术分类
      • 13.2.1 2D展示技术
      • 13.2.2 3D渲染技术
      • 13.2.3 体感互动技术
      • 13.2.4 虚拟现实技术
      • 13.2.5 增强现实技术
      • 13.2.6 可穿戴技术
      • 13.2.7 可植入设备
      • 13.3 练习题
      • 参考文献
      • 第14章 大数据安全与隐私
      • 14.1 云计算时代安全与隐私问题凸显
      • 14.2 云计算与大数据时代的安全挑战
      • 14.2.1 大数据时代的安全需求
      • 14.2.2 信息安全的发展历程
      • 14.2.3 新兴信息技术带来的安全挑战
      • 14.3 如何解决安全问题
      • 14.3.1 云计算安全防护框架
      • 14.3.2 基础云安全防护关键技术
      • 14.3.3 创立本质安全的新型IT体系
      • 14.4 隐私问题
      • 14.4.1 防不胜防的隐私泄露
      • 14.4.2 隐私保护的政策法规
      • 14.4.3 隐私保护技术
      • 14.5 练习题
      • 参考文献
      • 第15章 大数据技术发展趋势
      • 15.1 实时化
      • 15.2 内存计算
      • 15.2.1 机遇与挑战
      • 15.2.2 研究进展
      • 15.2.3 发展展望
      • 15.3 泛在化
      • 15.3.1 发展现状
      • 15.3.2 发展趋势
      • 15.4 智能化
      • 15.4.1 传统人工智能
      • 15.4.2 基于大数据的人工智能
      • 15.5 练习题
      • 参考文献
      • 第16章 知名企业大数据架构简介
      • 16.1 腾讯
      • 16.1.1 背景介绍
      • 16.1.2 整体架构
      • 16.2 淘宝
      • 16.2.1 背景介绍
      • 16.2.2 整体架构
      • 16.3 Facebook
      • 16.3.1 背景介绍
      • 16.3.2 整体架构
      • 16.3.3 技术架构展望
      • 16.4 Twitter
      • 16.4.1 背景介绍
      • 16.4.2 整体架构
      • 16.4.3 技术架构展望
      • 16.5 Netflix
      • 16.5.1 背景介绍
      • 16.5.2 整体架构
      • 16.5.3 Netflix个性化和推荐系统架构
      • 16.6 练习题
      • 参考文献

      学习笔记

      vue大数据表格卡顿问题的完美解决方案

      前言 vue渲染小数据挺快,大数据vue开始出现卡顿现象,本文讲给大家详细介绍关于vue大数据表格卡顿问题的解决方法 点我在线体验Demo(请用电脑查看) 亲测苹果电脑,chrome浏览器无卡顿现象,其它浏览器并未测试,如遇到卡顿请备注系统和浏览器,方便我后续优化,谢谢 先看一下效果,一共1000 X 100 = 10W个单元格基本感受不到卡顿,而且每个单元格点击可以编辑,支持固定头和固定列 项目源代码地址 Github(本地下载) 解决问题核心点:横向滚动加载,竖向滚动加载 项目背景 笔者最近在做广告排期功能,需要进行点位预占,大的合同可能需要对多个资源排期,周期可能到几年这样,然后我们的页面交互是这……

      Python如何处理大数据?3个技巧效率提升攻略(推荐)

      如果你有个5、6 G 大小的文件,想把文件内容读出来做一些处理然后存到另外的文件去,你会使用什么进行处理呢?不用在线等,给几个错误示范:有人用multiprocessing 处理,但是效率非常低。于是,有人用python处理大文件还是会存在效率上的问题。因为效率只是和预期的时间有关,不会报错,报错代表程序本身出现问题了~ 所以,为什么用python处理大文件总有效率问题? 如果工作需要,立刻处理一个大文件,你需要注意两点: 01、大型文件的读取效率 面对100w行的大型数据,经过测试各种文件读取方式,得出结论: with open(filename,"rb") as f: for fLine in f: pass 方式最快,100w行全遍历2.7秒。 基本满足中大型文……

      30个mysql千万级大数据SQL查询优化技巧详解

      1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num is null可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:select id from t where num=0 3.应尽量避免在 where 子句中使用!=或操作符,否则引擎将放弃使用索引而进行全表扫描。 4.应尽量避免在 where 子句中使用or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num=10 or num=20可以这样查询:select id from t where num=10 union all select id from t where num=20 5.in 和……

      Python中大数据处理详解

      分享 知识要点: lubridate包拆解时间 | POSIXlt 利用决策树分类,利用随机森林预测 利用对数进行fit,和exp函数还原 训练集来自Kaggle华盛顿自行车共享计划中的自行车租赁数据,分析共享自行车与天气、时间等关系。数据集共11个变量,10000多行数据。 首先看一下官方给出的数据,一共两个表格,都是2011-2012年的数据,区别是Test文件是每个月的日期都是全的,但是没有注册用户和随意用户。而Train文件是每个月只有1-20天,但有两类用户的数量。 求解:补全Train文件里21-30号的用户数量。评价标准是预测与真实数量的比较。 1.png 首先加载文件和包 library(lubridate)library(randomForest)library(readr)setwd(E:)data-read_csv(t……

      python分块读取大数据,避免内存不足的方法

      如下所示: def read_data(file_name): ''' file_name:文件地址 ''' inputfile = open(file_name, 'rb') #可打开含有中文的地址 data = pd.read_csv(inputfile, iterator=True) loop = True chunkSize = 1000 #一千行一块 chunks = [] while loop: try: chunk = dcs.get_chunk(chunkSize) chunks.append(chunk) except StopIteration: loop = False print("Iteration is stopped.") data = pd.concat(chunks, ignore_index=True) #print(train.head()) return data 以上这篇python分块读取大数据,避免内存不足的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

      以上就是本次介绍的大数据电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:精通Python爬虫框架Scrapy

      下一篇:Web前端自动化构建

      展开 +

      收起 -

      下载地址:百度网盘下载
      大数据相关电子书
      大数据搜索与日志挖掘及可视化方案
      大数据搜索与日志挖掘及可视化方案 第2版

      大数据的搜索与挖掘,在当今的互联网+时代是很有必要的。本书提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理

      立即下载
      数据架构:大数据、数据仓库以及Data Vault
      数据架构:大数据、数据仓库以及Data Vault 影印中文版 立即下载
      MongoDB大数据处理权威指南
      MongoDB大数据处理权威指南 全书完整版

      MongoDB大数据处理权威指南(第3版)对于MongoDB3干了细致升级,展现MongoDB的全部最新消息特点,包含2.2版导入的集聚架构、2.4版导入的哈希数据库索引及其3.2版本号的WiredTiger,还新列入Node.js和P

      立即下载
      Python金融大数据分析
      Python金融大数据分析 全书超清版 立即下载
      大数据Spark企业级实战
      大数据Spark企业级实战 完整影印版

      Spark是现如今互联网大数据行业最活跃性、最受欢迎、最高效率的互联网大数据通用性测算服务平台,是Apache手机软件慈善基金会下全部开源网站项目中几大*开源网站项目之首。 在OneStacktoru

      立即下载
      大数据基础编程、实验和案例教程
      大数据基础编程、实验和案例教程 清晰影印版

      本书以大数据分析全流程为主线,介绍了数据采集、数据存储与管理、数据处理与分析、数据可视化等环节典型软件的安装、使用和基础编程方法。具有一定的参考价值,感兴趣的小伙伴们可以参考一下

      立即下载
      企业级大数据平台构建:架构与实现
      企业级大数据平台构建:架构与实现 完整影印版

      完整的介绍了构建一个真实可用、安全可靠的企业级大数据平台所需要运用的知识体系,及构建的具体步骤和方法,手把手教你如何拉通Hadoop体系技术栈,欢迎下载

      立即下载
      零基础学大数据算法
      零基础学大数据算法 影印完整版

      本书是通俗易懂的大数据算法教程。通篇采用师生对话的形式,旨在用通俗的语言、轻松的气氛,帮助读者理解大数据计算领域中的基础算法和思想。

      立即下载
      Hadoop大数据平台构建与应用
      Hadoop大数据平台构建与应用 完整影印版

      具有较强的实用性和可操作性,语言精练,通俗易懂,操作步骤描述详尽,并配有大量操作图例,感兴趣的可以下载学习

      立即下载
      Spark与Hadoop大数据分析
      Spark与Hadoop大数据分析 超清影印版

      这本书系统讲解了利用Hadoop和Spark及其生态系统里的一系列工具进行大数据分析的方法,配套详细的实现示例,是快速掌握大数据分析基础架构及其实施方法的详实参考

      立即下载
      读者留言
      杨明

      杨明 提供上传

      资源
      47
      粉丝
      23
      喜欢
      119
      评论
      14

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com