标签分类
当前位置:首页 > 程序设计电子书 > 大数据电子书网盘下载
大数据分析:R基础及应用 大数据分析:R基础及应用
码小辫

码小辫 提供上传

资源
46
粉丝
21
喜欢
157
评论
3

    大数据分析:R基础及应用 PDF 高清版

    大数据电子书
    • 发布时间:

    给大家带来的一篇关于大数据相关的电子书资源,介绍了关于大数据分析、R基础、应用方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小26.8 MB,中科院深圳技术研编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.2,更多相关的学习资源可以参阅 程序设计电子书数据库电子书、等栏目。

  • 大数据分析:R基础及应用 PDF 下载
  • 下载地址:https://pan.baidu.com/s/1YSz17uRm5n27fRwnPNOm-A
  • 分享码:aqr1
  • 大数据分析:R基础及应用 PDF

    在大数据时代,R以其强大的数据分析挖掘、可视化绘图等功能,越来越受到社会各个领域的青睐。现在,R的计算引擎、性能、程序包都得到了提升,其中R与大数据分析平台Hadoop的结合,实现了R对大数据的分析式处理分析。这些不仅大大扩展了R的应用,也扩大了R在各行业的需求。

    为了更好地适应新形势,掌握大数据分析处理的相关知识是很有必要的。本书从理论基础、方法、实证三方面详细地阐释了R和RHadoop的相关理论、技术以及应用,使读者了解大数据的基础概念,掌握R以及Rhadoop大数据分析技术。本书不仅适合高等院校的各相关专业的本专科生、研究生,也适合零编程基础的科研人员以及对大数据分析技术感兴趣的人士阅读。本书在内容的选择和结构的安排上进行了深入的思考,使得不论是R或RHadoop的初学者还是具备一定相关专业知识的人员都能从本书中得到一定的收获或启发。

    目录

    • 第一部分大数据简介
    • 第1章大数据概述
    • 1.1大数据的概念
    • 1.2大数据的特征
    • 1.3大数据的产生
    • 1.4大数据应用案例
    • 第2章大数据相关技术
    • 2.1数据采集和准备
    • 2.2分布式数据库
    • 2.3分布式数据分析框架
    • 2.3.1Hadoop
    • 2.3.2HDFS
    • 2.3.3HBase
    • 2.3.4Hive
    • 2.3.5MapReduce
    • 2.3.6Strom
    • 2.4大数据分析与R
    • 2.4.1RHadoop
    • 2.4.2RHIPE
    • 2.4.3RHive
    • 2.4.4RHBase
    • 2.5国泰安的大数据
    • 2.5.1大数据实验室建设
    • 2.5.2大数据分析平台
    • 第二部分R语言
    • 第3章R语言简介
    • 3.1R语言概述
    • 3.2R的下载、安装和使用
    • 3.2.1RGui界面
    • 3.2.2RStudio界面
    • 3.2.3R的运行
    • 3.2.4工作目录和工作空间
    • 3.2.5R语言的帮助
    • 3.3R的包
    • 3.3.1包的获取
    • 3.3.2包的安装
    • 3.3.3包的加载
    • 3.3.4包的使用
    • 第4章R语言基本操作
    • 4.1数据结构
    • 4.2数据的基本操作
    • 4.2.1赋值和创建
    • 4.2.2数据的运算
    • 4.2.3数据的导入
    • 4.3数据的管理
    • 4.3.1数据排序
    • 4.3.2数据集的合并
    • 4.3.3剔除变量
    • 4.3.4数据集提取
    • 4.3.5subset函数
    • 4.4常用函数
    • 第5章R语言绘图
    • 5.1绘图参数
    • 5.1.1符号、线条与颜色
    • 5.1.2标题、坐标轴与图例
    • 5.1.3文本属性
    • 5.1.4图形的组合
    • 5.2高级绘图函数
    • 5.2.1通用二维图
    • 5.2.2饼图
    • 5.2.3箱线图
    • 5.2.4条形图
    • 5.2.5直方图
    • 5.2.6核密度图
    • 5.2.7点图
    • 5.3低级绘图函数
    • 第6章R语言数据分析
    • 6.1数据处理基础函数
    • 6.1.1数学函数
    • 6.1.2统计函数
    • 6.1.3概率函数
    • 6.1.4数据分析实例
    • 6.2描述性统计分析
    • 6.2.1描述统计函数
    • 6.2.2软件包的描述统计
    • 6.3多元统计分析
    • 6.3.1方差分析
    • 6.3.2判别分析
    • 6.3.3聚类分析
    • 6.3.4主成分分析
    • 6.3.5因子分析
    • 6.3.6典型相关分析
    • 第三部分专题实证研究
    • 第7章金融时间序列建模专题
    • 7.1金融时间序列
    • 7.2ARMA模型
    • 7.2.1ARMA模型简介
    • 7.2.2ARMA模型定阶
    • 7.2.3ARMA模型拟合
    • 7.3GARCH模型
    • 7.3.1GARCH模型简介
    • 7.3.2GARCH模型拟合
    • 第8章动态面板数据专题
    • 8.1GMM估计
    • 8.1.1系统GMM估计
    • 8.1.2GMM估计原理
    • 8.2动态面板数据模型的系统GMM估计
    • 第9章数据挖掘专题
    • 9.1关联规则
    • 9.2降维分析
    • 9.3社交网络分析
    • 9.4贝叶斯分类法
    • 9.4.1贝叶斯定理
    • 9.4.2贝叶斯分类实例
    • 9.5决策树
    • 9.5.1决策树原理
    • 9.5.2决策树分类实例
    • 9.6人工神经网络
    • 9.6.1三层前馈神经网络原理
    • 9.6.2神经网络分类实例
    • 9.7支持向量机
    • 9.7.1支持向量机原理
    • 9.7.2支持向量机分类实例
    • 第10章信息可视化专题
    • 10.1绘制地图
    • 10.1.1世界地图
    • 10.1.2中国地图
    • 10.1.3公路线图
    • 10.2可视化实例
    • 10.2.1数据
    • 10.2.2ggmap
    • 第四部分RHadoop案例分析
    • 第11章RHadoop的基本操作
    • 11.1数据文件的读取
    • 11.2包的加载
    • 11.3基本函数
    • 第12章RHadoop环境下案例分析
    • 12.1回归分析
    • 12.1.1回归分析原理
    • 12.1.2线性回归分析案例
    • 12.2Logistic分析
    • 12.2.1Logistic分析原理
    • 12.2.2Logistic分析案例
    • 12.3判别分析
    • 12.3.1线性判别分析原理
    • 12.3.2线性判别分析案例
    • 12.4聚类分析
    • 12.4.1Kmeans聚类分析原理
    • 12.4.2Kmeans聚类分析案例
    • 12.5主成分分析
    • 12.5.1主成分分析原理
    • 12.5.2主成分分析案例
    • 12.6因子分析
    • 12.6.1因子分析原理
    • 12.6.2因子分析案例
    • 12.7商品推荐算法
    • 12.7.1商品推荐算法原理
    • 12.7.2商品推荐案例
    • 12.8差异分析
    • 12.8.1多维标度法的原理
    • 12.8.2差异分析案例
    • 附录一国泰安CSMAR数据下载
    • 附录二深圳国泰安教育技术股份有限公司简介
    • 参考文献

    上一篇:有趣的二进制:软件安全与逆向分析  下一篇:量化投资:以R语言为工具

    展开 +

    收起 -

    码小辫二维码
     ←点击下载即可登录

    大数据相关电子书
    学习笔记
    网友NO.750170

    为什么入门大数据选择Python而不是Java?

    马云说:“未来最大的资源就是数据,不参与大数据十年后一定会后悔。”毕竟出自wuli马大大之口,今年二月份我开始了学习大数据的道路,直到现在对大数据的学习脉络和方法也渐渐清晰。今天我们就来谈谈学习大数据入门语言的选择。当然并不只是我个人之见,此外我搜集了各路大神的见解综合起来跟大家做个讨论。 java和python的区别到底在哪里? 官方解释:Java是一门面向对象编程语言,不仅吸收了C++语言的各种优点,还摒弃了C++里难以理解的多继承、指针等概念,因此Java语言具有功能强大和简单易用两个特征。Java语言作为静态面向对象编程语言的代表,极好地实现了面向对象理论,允许程序员以优雅的思维方式进行复杂的编程。Java具有简单性、面向对象、分布式、健壮性、安全性、平台独立与可移植性、多线程、动态性等特点 。Java可以编写桌面应用程序、Web应用程序、分布式系统和嵌入式系统应用程序等。 Python是一种面向对象的解释型计算机程序设计语言,Python是纯粹的自由软件, 源代码和解释器CPython遵循 GPL(GNU General Public License)协议。Python语法简洁清晰,特色之一是强制用空白符(white space)作为语句缩进。Python具有丰富和强大的库。它常被昵称为胶水语言,能够把用其他语言制作的各种模块(尤其是C/C++)……

    网友NO.910488

    MySQL中使用innobackupex、xtrabackup进行大数据的备份和还原教程

    大数据量备份与还原,始终是个难点。当MYSQL超10G,用mysqldump来导出就比较慢了。在这里推荐xtrabackup,这个工具比mysqldump要快很多。 一、Xtrabackup介绍 1、Xtrabackup是什么 Xtrabackup是一个对InnoDB做数据备份的工具,支持在线热备份(备份时不影响数据读写),是商业备份工具InnoDB Hotbackup的一个很好的替代品。 Xtrabackup有两个主要的工具:xtrabackup、innobackupex 1、xtrabackup只能备份InnoDB和XtraDB两种数据表,而不能备份MyISAM数据表 2、 innobackupex是参考了InnoDB Hotbackup的innoback脚本修改而来的.innobackupex是一个perl脚本封装,封装了xtrabackup。主要是为了方便的 同时备份InnoDB和MyISAM引擎的表,但在处理myisam时需要加一个读锁。并且加入了一些使用的选项。如slave-info可以记录备份恢 复后,作为slave需要的一些信息,根据这些信息,可以很方便的利用备份来重做slave。 2、Xtrabackup可以做什么 : 在线(热)备份整个库的InnoDB、 XtraDB表 在xtrabackup的上一次整库备份基础上做增量备份(innodb only) 以流的形式产生备份,可以直接保存到远程机器上(本机硬盘空间不足时很有用) MySQL数据库本身提供的工具并不支持真正的增量备份,二进制日志恢复是point-in-time(时间点)的恢复而不是增量备份。 Xtrabackup工具支持对InnoDB存储引擎的增量备份,工作原理如下: (1)首先完成……

    网友NO.253753

    30个mysql千万级大数据SQL查询优化技巧详解

    1.对查询进行优化,应尽量避免全表扫描,首先应考虑在 where 及 order by 涉及的列上建立索引。 2.应尽量避免在 where 子句中对字段进行 null 值判断,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num is null可以在num上设置默认值0,确保表中num列没有null值,然后这样查询:select id from t where num=0 3.应尽量避免在 where 子句中使用!=或操作符,否则引擎将放弃使用索引而进行全表扫描。 4.应尽量避免在 where 子句中使用or 来连接条件,否则将导致引擎放弃使用索引而进行全表扫描,如:select id from t where num=10 or num=20可以这样查询:select id from t where num=10 union all select id from t where num=20 5.in 和 not in 也要慎用,否则会导致全表扫描,如:select id from t where num in(1,2,3) 对于连续的数值,能用 between 就不要用 in 了:select id from t where num between 1 and 3 6.下面的查询也将导致全表扫描:select id from t where name like ‘%李%'若要提高效率,可以考虑全文检索。 7. 如果在 where 子句中使用参数,也会导致全表扫描。因为SQL只有在运行时才会解析局部变量,但优化程序不能将访问计划的选择推迟到运行时;它必须在编译时进行选择。然 而,如果在编译时建立访问计划,变量的值还是未知的,因而无法作为索引选择的输入项。如下面语句……

    网友NO.863522

    vue大数据表格卡顿问题的完美解决方案

    前言 vue渲染小数据挺快,大数据vue开始出现卡顿现象,本文讲给大家详细介绍关于vue大数据表格卡顿问题的解决方法 点我在线体验Demo(请用电脑查看) 亲测苹果电脑,chrome浏览器无卡顿现象,其它浏览器并未测试,如遇到卡顿请备注系统和浏览器,方便我后续优化,谢谢 先看一下效果,一共1000 X 100 = 10W个单元格基本感受不到卡顿,而且每个单元格点击可以编辑,支持固定头和固定列 项目源代码地址 Github(本地下载) 解决问题核心点:横向滚动加载,竖向滚动加载 项目背景 笔者最近在做广告排期功能,需要进行点位预占,大的合同可能需要对多个资源排期,周期可能到几年这样,然后我们的页面交互是这样 横向每个月30个单元格,最多的3年,36个月,每行36*30=1080个单元格 竖向100个资源,总共约️10W个单元格,然后每个单元格里面会有一个输入框,一个库存总数,所以总数是20W个,内网使用,接口请求根本不是问题,可以浏览器渲染就扛不住了接口回来之后会出现几十秒的白屏,整个页面处于卡死状态 这还不算,加载出之后页面操作也是非常卡,滑动延迟严重,页面基本处于瘫痪状态 之前的功能是基于jquery开发的,项目重构用的vue,UI采用了ElementUI,ElmentUI中的表格在数据量较大是有严重的性能问题,最直接的表现就是白屏……

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明