标签分类
当前位置:首页 > 程序设计电子书 > R语言电子书网盘下载
数据科学:R语言实现 数据科学:R语言实现
千年流沙

千年流沙 提供上传

资源
12
粉丝
14
喜欢
69
评论
13

    数据科学:R语言实现 PDF 完整超清版

    R语言电子书
    • 发布时间:

    给大家带来的一篇关于R语言相关的电子书资源,介绍了关于数据科学、R语言方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小45.2 MB,丘祐玮编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.8,更多相关的学习资源可以参阅 程序设计电子书、等栏目。

  • 数据科学:R语言实现 PDF 下载
  • 下载地址:https://pan.baidu.com/s/1KAT7WpkDUfwwbXxq8yv6wg
  • 分享码:y618
  • 数据科学:R语言实现 PDF

    这书根据简易形象化的R编码、慢慢深层次的解读及其节省成本的方式 ,出示了很多数据统计分析样例,终协助你高效率地处理各种统计数据难题。第1章详细介绍了怎样建立R涵数,防止多余的编码反复。你能学得怎样依靠R程序包在各种各样数据库上提前准备、解决和实行繁杂的ETL实际操作。后边的章节目录详细介绍了财务报表的时间序列分析,一起还详细介绍了深度学习的好多个网络热点,比如数据分类、重归、聚类分析法、关联规则发掘、降维等。这书的末尾中,你能学得怎样处理具体难题,并可以在数据统计分析全过程中轻轻松松地得出解决方法。

    目录

    • 推荐序
    • 译者序
    • 前言
    • 第1章 R中的函数1
    • 1.1引言1
    • 1.2 创建R函数2
    • 1.3 匹配参数3
    • 1.4 理解环境5
    • 1.5 使用词法域8
    • 1.6 理解闭包10
    • 1.7 执行延迟计算12
    • 1.8 创建中缀操作符13
    • 1.9 使用替代函数15
    • 1.10 处理函数中的错误17
    • 1.11 调试函数21
    • 第2章 数据抽取、转换和加载28
    • 2.1 引言28
    • 2.2 下载公开数据28
    • 2.3 读取和写入CSV文件31
    • 2.4 扫描文本文件32
    • 2.5 使用Excel文件34
    • 2.6 从数据库中读取数据36
    • 2.7 爬取网络数据38
    • 2.8 获取Facebook数据44
    • 2.9 使用twitteR49
    • 第3章 数据预处理和准备53
    • 3.1 引言53
    • 3.2 重命名数据变量53
    • 3.3 转换数据类型55
    • 3.4 使用日期格式57
    • 3.5 添加新的记录58
    • 3.6 过滤数据60
    • 3.7 舍弃数据63
    • 3.8 合并数据64
    • 3.9 排列数据65
    • 3.10 重塑数据67
    • 3.11 检测缺失数据69
    • 3.12 估计缺失数据71
    • 第4章 数据操作74
    • 4.1 引言74
    • 4.2 使用data.table加强data.frame74
    • 4.3 使用data.table管理数据77
    • 4.4 使用data.table执行快速聚合82
    • 4.5 使用data.table合并大型数据集85
    • 4.6 使用dplyr进行数据抽取和切片88
    • 4.7 使用dplyr进行数据抽样91
    • 4.8 使用dplyr选取列92
    • 4.9 使用dplyr进行链式操作94
    • 4.10 使用dplyr整理行95
    • 4.11 使用dplyr消除重复行97
    • 4.12 使用dplyr添加新列98
    • 4.13 使用dplyr汇总数据99
    • 4.14 使用dplyr合并数据102
    • 第5章 使用ggplot2可视化数据105
    • 5.1 引言105
    • 5.2 使用ggplot2创建基础图形106
    • 5.3 改变美学映射109
    • 5.4 引入几何对象112
    • 5.5 执行变换116
    • 5.6 调整图形尺度118
    • 5.7 分面120
    • 5.8 调整主题122
    • 5.9 组合图形124
    • 5.10 创建地图126
    • 第6章 制作交互式报告131
    • 6.1 引言131
    • 6.2 创建R Markdown报告131
    • 6.3 学习markdown语法135
    • 6.4 嵌入R代码块137
    • 6.5 使用ggvis创建交互式图形140
    • 6.6 理解基础语法143
    • 6.7 控制坐标轴和图例148
    • 6.8 使用尺度153
    • 6.9 给ggvis图形添加交互154
    • 6.10 创建R Shiny文档159
    • 6.11 发布R Shiny报告164
    • 第7章 概率分布模拟169
    • 7.1 引言169
    • 7.2 生成随机样本169
    • 7.3 理解均匀分布171
    • 7.4 生成二项随机变量173
    • 7.5 生成泊松随机变量175
    • 7.6 从正态分布中抽样177
    • 7.7 从卡方分布中抽样183
    • 7.8 理解学生t-分布185
    • 7.9 从数据集中抽样187
    • 7.10 模拟随机过程188
    • 第8章 R中的统计推断191
    • 8.1 引言191
    • 8.2 获取置信区间191
    • 8.3 执行Z-检验196
    • 8.4 执行学生T-检验199
    • 8.5 执行精确二项检验202
    • 8.6 执行Kolmogorov-Smirnov检验203
    • 8.7 使用Pearson卡方检验205
    • 8.8 理解Wilcoxon秩和检验207
    • 8.9 执行单因素方差分析209
    • 8.10 执行双因素方差分析212
    • 第9章 R语言规则和模式挖掘216
    • 9.1 引言216
    • 9.2 把数据转换为事务216
    • 9.3 展示事务和关联218
    • 9.4 使用Apriori规则挖掘关联关系220
    • 9.5 对冗余规则剪枝223
    • 9.6 可视化关联规则224
    • 9.7 使用Eclat挖掘频繁项集226
    • 9.8 使用时序信息创建事务228
    • 9.9 使用cSPADE挖掘频繁序列模式231
    • 第10章 R语言时间序列挖掘235
    • 10.1 引言235
    • 10.2 创建时间序列数据235
    • 10.3 绘制时间序列对象238
    • 10.4 分解时间序列241
    • 10.5 平滑时间序列243
    • 10.6 预测时间序列247
    • 10.7 选取ARIMA模型251
    • 10.8 创建ARIMA模型255
    • 10.9 使用ARIMA模型预测257
    • 10.10 使用ARIMA模型预测股票价格260
    • 第11章 监督式机器学习264
    • 11.1 引言264
    • 11.2 使用lm拟合线性回归模型264
    • 11.3 汇总线性模型拟合266
    • 11.4 使用线性回归来预测未知值268
    • 11.5 度量回归模型的性能270
    • 11.6 执行多元回归分析272
    • 11.7 使用逐步回归选取最优拟合回归模型274
    • 11.8 应用高斯模型泛化线性回归276
    • 11.9 执行逻辑斯谛回归分析277
    • 11.10 使用递归分割树构建分类模型280
    • 11.11 可视化递归分割树282
    • 11.12 使用混淆矩阵度量模型性能283
    • 11.13 使用ROCR度量预测性能285
    • 第12章 非监督式机器学习288
    • 12.1 引言288
    • 12.2 使用层次聚类法对数据聚类288
    • 12.3 切割树成聚类291
    • 12.4 使用k-means方法对数据聚类293
    • 12.5 使用基于密度的方法对数据聚类294
    • 12.6 从聚类中抽取轮廓信息296
    • 12.7 比较多种聚类方法298
    • 12.8 使用基于密度的聚类识别数字299
    • 12.9 使用k-means聚类方法分组相似文本文档301
    • 12.10 使用主成分分析法进行数据降维303
    • 12.11 使用陡坡图确定主成分数量305
    • 12.12 使用Kaiser方法确定主成分数量306
    • 12.13 使用双标图可视化多变元数据308

    上一篇:程序员面试手册:概念、编程问题及面试题  下一篇:Python微服务开发

    展开 +

    收起 -

    码小辫二维码
     ←点击下载即可登录

    R语言相关电子书
    学习笔记
    网友NO.151004

    r语言和python什么意思

    R语言 1、R是一个有着统计分析功能及强大作图功能的软件系统。R内含了许多实用的统计分析及作图参数。作图参数能将产生的展示在一个独立的窗口中。并能将之保存为各种形式的文件(jpg,png,bmp,ps,pdf,emf,pictex,xfig),具体形式取决于操作系统。统计分析的结果也能被直接显示出来,一些中间(如P-值,回归系统,残差等)既可保存到专门的文件中,也可以直接用作进一步的分析 2、在R语言中,使用者可以使用循环语句来连续分析多个数据集,也可将多个不同的统计函数结合在一个语句中执行更复杂的分析。R使用者还可以借鉴网上提供的用S编写的大量程序,而且大多数都能被R直接调用。 python语言 Python是一种计算机程序设计语言。是一种面向对象的动态类型语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的、大型项目的开发。 Python是完全面向对象的语言。函数、模块、数字、字符串都是对象。并且完全支持继承、重载、派生、多继承,有益于增强源代码的复用性。Python支持重载运算符和动态类型。相对于Lisp这种传统的函数式编程语言,Python对函数式设计只提供了有限的支持。有两个标准库(functools, itertools)提供了Haskell和Standard ML中久经考验的函数式程序设计……

    网友NO.353372

    r语言处理数据比python慢吗

    什么是R语言? R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发(也因此称为R),现在由“R开发核心团队”负责开发。R基于S语言的一个GNU计划项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。R的语法是来自Scheme。(推荐学习:Python视频教程) R的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同时有人开发了几种图形用户界面。 R的功能能够通过由用户撰写的包增强。增加的功能有特殊的统计技术、绘图功能,以及编程接口和数据输出/输入功能。这些软件包是由R语言、LaTeX、Java及最常用C语言和Fortran撰写。下载的可执行文件版本会连同一批核心功能的软件包,而根据CRAN纪录有过千种不同的软件包。其中有几款较为常用,例如用于经济计量、财经分析、人文科学研究以及人工智能。 Python与R语言的共同特点 Python和R在数据分析和数据挖掘方面都有比较专业和全面的模块,很多常用的功能,比如矩阵运算、向量运算等都有比较高级的用法 Python和R两门语言有多平台适应性,……

    网友NO.960229

    r语言和python有必要都学吗

    R和Python是目前最流行的两款高级编程语言,被大量运用于数据科学领域。两者都是开源的,也都有非常活跃的社区来支撑。那么问题来了:r语言和python有必要都学吗 R: R语言由新西兰奥克兰大学的Ross Ihaka和Robert Gentleman于1995设计出来(由于两人的名字均以 ‘R’ 字母开头,因此命名为R语言),现在由“R核心开发团队“负责开发。 虽然R主要用于数据分析、绘图以及数据挖掘,但也有人用作矩阵计算。其计算速度可媲美专用于矩阵计算的开源软件GNU Octave和商业软件MATLAB。 起初R主要在学术研究中使用,但近年来在企业界也表现突出,这使得R成为企业中使用的全球发展最快的统计语言之一。对于数据科学任务,R的语法更直观形象 对于数据处理任务,很多时候R的语法会更简单。函数和参数的命名设计也更好,很容易记住和使用。 举个例子,我们将分别用R和Python来删掉Iris数据框中的两个变量(由于R和Python都有Iris数据框,因此我们使用这个数据框)。 我们来看看各自的语法: Python import seaborn as snsimport pandas as pdiris = sns.load_dataset('iris')iris.drop(['sepal_length', 'species'], axis = 1) R library(dplyr)select(iris, -sepal_length, -species) 为了删除变量,Python中使用了drop函数,而R中使用了select函数。我们来对比这两个函数(都在最后一行代码)的语法。 先……

    网友NO.342715

    R语言 vs Python对比:数据分析哪家强?

    什么是R语言? R语言,一种自由软件编程语言与操作环境,主要用于统计分析、绘图、数据挖掘。R本来是由来自新西兰奥克兰大学的罗斯·伊哈卡和罗伯特·杰特曼开发(也因此称为R),现在由“R开发核心团队”负责开发。R基于S语言的一个GNU计划项目,所以也可以当作S语言的一种实现,通常用S语言编写的代码都可以不作修改的在R环境下运行。R的语法是来自Scheme。 R的源代码可自由下载使用,亦有已编译的可执行文件版本可以下载,可在多种平台下运行,包括UNIX(也包括FreeBSD和Linux)、Windows和MacOS。R主要是以命令行操作,同时有人开发了几种图形用户界面。 R的功能能够通过由用户撰写的包增强。增加的功能有特殊的统计技术、绘图功能,以及编程接口和数据输出/输入功能。这些软件包是由R语言、LaTeX、Java及最常用C语言和Fortran撰写。下载的可执行文件版本会连同一批核心功能的软件包,而根据CRAN纪录有过千种不同的软件包。其中有几款较为常用,例如用于经济计量、财经分析、人文科学研究以及人工智能。 Python与R语言的共同特点 Python和R在数据分析和数据挖掘方面都有比较专业和全面的模块,很多常用的功能,比如矩阵运算、向量运算等都有比较高级的用法 Python和R两门语言有多平台适应性,linux、window都可以使用,并且……

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明