当前位置:首页 > 程序设计 >
《Julia数据科学应用》电子书封面

Julia数据科学应用

  • 发布时间:2019年11月08日 09:28:36
  • 作者:扎卡赖亚斯·弗格里斯
  • 大小:159.6 MB
  • 类别:Julia电子书
  • 格式:PDF
  • 版本:扫描清晰版
  • 评分:9.6

    Julia数据科学应用 PDF 扫描清晰版

      给大家带来的一篇关于Julia相关的电子书资源,介绍了关于Julia、数据科学、应用方面的内容,本书是由人民邮电出版社出版,格式为PDF,资源大小159.6 MB,扎卡赖亚斯·弗格里斯编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.8。

      内容介绍

      Julia数据科学应用 PDF

      数据科学通过各种统计学和机器学习的技术与方法,将数据转换为有用的信息或知识。Julia是一种在数据科学领域逐渐流行起来的语言。

      《Julia数据科学应用》会提出一系列在数据科学流程中常见的、有代表性的实际问题,并指导读者使用Julia去解决这些问题。全书共13章,涵盖了Julia基础知识、工作环境搭建、语言基础和高 级内容、数据科学应用、数据可视化、机器学习方法(包括无监督式学习方法和监督式学习方法)、图分析方法等重要的话题。附录部分给出了学习和使用Julia的一些有用的参考资料,还给出了各章的思考题的答案。

      本书适合对数据科学的知识和应用方法感兴趣的读者阅读,特别适合有志于学习Julia并从事数据科学相关工作的人员学习参考。

      目录

      • 第 1章 Julia简介 1
      • 1.1 Julia如何提高数据科学水平 2
      • 1.1.1 数据科学工作流程 3
      • 1.1.2 Julia被数据科学社区接受的过程 5
      • 1.2 Julia 扩展 6
      • 1.2.1 包的质量 6
      • 1.2.2 找到新的包 6
      • 1.3 关于本书 7
      • 第 2章 建立数据科学工作环境 9
      • 2.1 Julia IDE 9
      • 2.1.1 Juno 10
      • 2.1.2 IJulia 11
      • 2.1.3 其他IDE 12
      • 2.2 Julia扩展包 13
      • 2.2.1 找到并选择扩展包 13
      • 2.2.2 安装扩展包 14
      • 2.2.3 使用扩展包 15
      • 2.2.4 破解扩展包 16
      • 2.3 IJulia基础 16
      • 2.3.1 文件处理 16
      • 2.3.2 在.jl文件中组织代码 19
      • 2.3.3 引用代码 20
      • 2.3.4 工作目录 20
      • 2.4 要使用的数据集 21
      • 2.4.1 数据集描述 21
      • 2.4.2 下载数据集 23
      • 2.4.3 加载数据集 24
      • 2.5 在Julia中实现一个简单的机器学习算法 25
      • 2.5.1 算法描述 26
      • 2.5.2 算法实现 27
      • 2.5.3 算法测试 30
      • 2.6 将工作区保存到数据文件 32
      • 2.6.1 将数据保存为分隔值文件 32
      • 2.6.2 将数据保存为Julia数据文件 33
      • 2.6.3 将数据保存为文本文件 35
      • 2.7 帮助 36
      • 2.8 小结 36
      • 2.9 思考题 37
      • 第3章 Julia入门 39
      • 3.1 数据类型 39
      • 3.2 数组 42
      • 3.2.1 数组基础 42
      • 3.2.2 在数组中引用多个元素 43
      • 3.2.3 多维数组 44
      • 3.3 字典 44
      • 3.4 基本命令与函数 45
      • 3.4.1 print()和println() 46
      • 3.4.2 typemax()和typemin() 46
      • 3.4.3 collect() 47
      • 3.4.4 show() 47
      • 3.4.5 linspace() 48
      • 3.5 数学函数 48
      • 3.5.1 round() 48
      • 3.5.2 rand()和randn() 49
      • 3.5.3 sum() 52
      • 3.5.4 mean() 53
      • 3.6 数组与字典函数 53
      • 3.6.1 in 53
      • 3.6.2 append!() 54
      • 3.6.3 pop!() 54
      • 3.6.4 push!() 55
      • 3.6.5 splice!() 55
      • 3.6.6 insert!() 56
      • 3.6.7 sort()和sort!() 57
      • 3.6.8 get() 57
      • 3.6.9 keys()和values() 58
      • 3.6.10 length()和size() 58
      • 3.7 其他函数 59
      • 3.7.1 time() 59
      • 3.7.2 条件语句 59
      • 3.7.3 string() 61
      • 3.7.4 map() 62
      • 3.7.5 versioin() 62
      • 3.8 运算符、循环语句与条件语句 62
      • 3.8.1 运算符 63
      • 3.8.2 循环语句 64
      • 3.8.3 break命令 66
      • 3.9 小结 66
      • 3.10 思考题 67
      • 第4章 Julia进阶 68
      • 4.1 字符串处理 68
      • 4.1.1 split() 69
      • 4.1.2 join() 70
      • 4.1.3 正则表达式函数 70
      • 4.2 定制函数 74
      • 4.2.1 函数结构 74
      • 4.2.2 匿名函数 75
      • 4.2.3 多分派 75
      • 4.2.4 函数示例 76
      • 4.3 实现简单算法 77
      • 4.4 创建完整解决方案 79
      • 4.5 小结 83
      • 4.6 思考题 84
      • 第5章 Julia数据科学应用概述 85
      • 5.1 数据科学工作流程 85
      • 5.2 数据工程 88
      • 5.2.1 数据准备 88
      • 5.2.2 数据探索 90
      • 5.2.3 数据表示 92
      • 5.3 数据建模 93
      • 5.3.1 数据发现 93
      • 5.3.2 数据学习 94
      • 5.4 信息萃取 96
      • 5.4.1 数据产品创建 96
      • 5.4.2 知识、交付物与可视化产品 97
      • 5.5 保持开放型思维 99
      • 5.6 在实际问题中应用数据科学流程 99
      • 5.6.1 数据准备 99
      • 5.6.2 数据探索 100
      • 5.6.3 数据表示 101
      • 5.6.4 数据发现 101
      • 5.6.5 数据学习 102
      • 5.6.6 数据产品创建 102
      • 5.6.7 知识、交付物和可视化产品 103
      • 5.7 小结 103
      • 5.8 思考题 105
      • 第6章 Julia数据工程 106
      • 6.1 数据框 106
      • 6.1.1 创建并填充数据框 107
      • 6.1.2 数据框基础 108
      • 6.1.3 引用数据框中的特定变量 109
      • 6.1.4 探索数据框 109
      • 6.1.5 筛选数据框 110
      • 6.1.6 在数据框变量上应用函数 111
      • 6.1.7 使用数据框进行工作 111
      • 6.1.8 修改数据框 113
      • 6.1.9 对数据框的内容进行排序 113
      • 6.1.10 数据框的一些补充建议 114
      • 6.2 导入与导出数据 115
      • 6.2.1 使用.json数据文件 115
      • 6.2.2 保存数据到.json文件 115
      • 6.2.3 将数据文件加载到数据框 116
      • 6.2.4 保存数据框到数据文件 116
      • 6.3 数据清洗 117
      • 6.3.1 数值型数据的清洗 117
      • 6.3.2 文本型数据的清洗 118
      • 6.4 数据格式化与转换 119
      • 6.4.1 数值型数据的格式化 119
      • 6.4.2 文本数据的格式化 119
      • 6.4.3 数据类型的重要性 120
      • 6.5 对数值型数据进行转换 120
      • 6.5.1 标准化 121
      • 6.5.2 离散化(分箱)与二值化 122
      • 6.5.3 二值变量转换为连续型变量(仅对于二值分类问题) 123
      • 6.5.4 文本数据转换 124
      • 6.5.5 大小写标准化 124
      • 6.5.6 向量化 124
      • 6.6 初步的特征评价 126
      • 6.6.1 回归 126
      • 6.6.2 分类 126
      • 6.6.3 特征评价补充说明 127
      • 6.7 小结 128
      • 6.8 思考题 129
      • 第7章 探索数据集 130
      • 7.1 倾听数据 130
      • 本章要使用的扩展包 131
      • 7.2 计算基本统计量和相关性 131
      • 7.2.1 变量概要 133
      • 7.2.2 变量之间的相关性 134
      • 7.2.3 两个变量之间的可比性 136
      • 7.3 绘制统计图 136
      • 7.3.1 图形语法 137
      • 7.3.2 为可视化准备数据 137
      • 7.3.3 箱线图 138
      • 7.3.4 条形图 138
      • 7.3.5 折线图 139
      • 7.3.6 散点图 140
      • 7.3.7 直方图 143
      • 7.3.8 导出统计图到文件 144
      • 7.4 假设检验 145
      • 7.4.1 检验的基础知识 145
      • 7.4.2 错误类型 146
      • 7.4.3 灵敏度与特异度 146
      • 7.4.4 显著性水平与检验力 146
      • 7.4.5 KRUSKAL-WALLIS检验 147
      • 7.4.6 T-检验 147
      • 7.4.7 卡方检验 149
      • 7.5 其他检验 151
      • 7.6 统计检验附加说明 151
      • 7.7 案例研究:探索OnlineNewsPopularity数据集 151
      • 7.7.1 变量统计 152
      • 7.7.2 可视化 153
      • 7.7.3 假设 154
      • 7.7.4 奇妙的T-SNE方法 155
      • 7.7.5 结论 156
      • 7.8 小结 156
      • 7.9 思考题 159
      • 第8章 构建数据空间 160
      • 8.1 主成分分析 161
      • 8.1.1 在Julia中使用PCA 162
      • 8.1.2 独立成分分析:主成分分析的常用替代方法 164
      • 8.2 特征评价与选择 165
      • 8.2.1 方法论概述 165
      • 8.2.2 在Julia中使用余弦相似度进行特征评价与选择 166
      • 8.2.3 在Julia中使用DID进行特征评价与选择 168
      • 8.2.4 特征评价与选择方法的优缺点 170
      • 8.3 其他数据降维技术 170
      • 8.3.1 其他降维方法概述 171
      • 8.3.2 何时使用高 级降维方法 172
      • 8.4 小结 172
      • 8.5 思考题 173
      • 第9章 数据抽样与结果评价 175
      • 9.1 抽样技术 175
      • 9.1.1 基本抽样 176
      • 9.1.2 分层抽样 176
      • 9.2 分类问题的性能指标 177
      • 9.2.1 混淆矩阵 177
      • 9.2.2 准确度 178
      • 9.2.3 精 确度与召回度 180
      • 9.2.4 F1指标 181
      • 9.2.5 误判成本 181
      • 9.2.6 受试者工作特征(ROC)曲线及相关指标 182
      • 9.3 回归问题的性能指标 185
      • 9.3.1 MSE及其变种RMSE 186
      • 9.3.2 SSE 187
      • 9.3.3 其他指标 187
      • 9.4 K折交叉验证(KFCV) 188
      • 9.4.1 在Julia中应用KFCV 189
      • 9.4.2 KFCV小提示 189
      • 9.5 小结 190
      • 9.6 思考题 192
      • 第 10章 无监督式机器学习 193
      • 10.1 无监督式学习基础知识 193
      • 10.1.1 聚类的类型 194
      • 10.1.2 距离的度量 195
      • 10.2 使用K-均值算法分组数据 196
      • 10.2.1 使用Julia实现K-均值聚类 197
      • 10.2.2 对K-均值算法的使用建议 198
      • 10.3 密度和DBSCAN算法 199
      • 10.3.1 DBSCAN算法 199
      • 10.3.2 在Julia中应用DBSCAN 200
      • 10.4 层次聚类 201
      • 10.4.1 在Julia中使用层次聚类 201
      • 10.4.2 何时使用层次聚类 203
      • 10.5 聚类的验证方式 203
      • 10.5.1 Silhouettes 203
      • 10.5.2 关于聚类验证的一些建议 204
      • 10.6 关于有效进行聚类的一些建议 204
      • 10.6.1 处理高维数据 205
      • 10.6.2 标准化 205
      • 10.6.3 可视化建议 205
      • 10.7 小结 206
      • 10.8 思考题 207
      • 第 11章 监督式机器学习 209
      • 11.1 决策树 210
      • 11.1.1 在Julia中使用决策树 211
      • 11.1.2 关于决策树的一些建议 214
      • 11.2 回归树 214
      • 11.2.1 在Julia中实现回归树 215
      • 11.2.2 关于回归树的一些建议 216
      • 11.3 随机森林 216
      • 11.3.1 在Julia中使用随机森林进行分类 216
      • 11.3.2 在Julia中使用随机森林进行回归 218
      • 11.3.3 关于随机森林的一些建议 219
      • 11.4 基本神经网络 220
      • 11.4.1 在Julia中使用神经网络 221
      • 11.4.2 关于神经网络的一些建议 223
      • 11.5 极限学习机 224
      • 11.5.1 在Julia中使用ELM 224
      • 11.5.2 关于ELM的一些建议 226
      • 11.6 用于回归分析的统计模型 227
      • 11.6.1 在Julia中使用统计回归 227
      • 11.6.2 关于统计回归的一些建议 230
      • 11.7 其他监督式学习系统 230
      • 11.7.1 提升树 230
      • 11.7.2 支持向量机 230
      • 11.7.3 直推式系统 231
      • 11.7.4 深度学习系统 232
      • 11.7.5 贝叶斯网络 232
      • 11.8 小结 233
      • 11.9 本章思考题 235
      • 第 12章 图分析 236
      • 12.1 图的重要性 237
      • 12.2 定制数据集 239
      • 12.3 图的统计量 240
      • 12.4 环的检测 242
      • 用Julia检测环 243
      • 12.5 连通子图 244
      • 12.6 团 245
      • 12.7 图的路径 246
      • 12.8 生成树 248
      • 12.8.1 在Julia中实现MST 249
      • 12.8.2 用文件保存和加载图 250
      • 12.9 Julia在图分析中的作用 251
      • 12.10 小结 252
      • 12.11 思考题 254
      • 第 13章 更上一层楼 255
      • 13.1 Julia社区 255
      • 13.1.1 与其他Julia用户进行交流 255
      • 13.1.2 代码库 256
      • 13.1.3 视频文件 256
      • 13.1.4 新闻 257
      • 13.2 学以致用 257
      • 13.2.1 从这些特征开始 258
      • 13.2.2 关于这个项目的一些思考 259
      • 13.3 在数据科学中使用Julia的思考 260
      • 13.3.1 不断提高Julia编程水平 260
      • 13.3.2 贡献Julia项目 261
      • 13.3.3 Julia在数据科学中的未来 262
      • 附录A 下载安装Julia与IJulia 264
      • 附录B 与Julia相关的一些常用站点 266
      • 附录C 本书所用的扩展包 268
      • 附录D Julia与其他平台的集成 269
      • D.1 Julia与R的集成 269
      • D.1.1 在R中运行Julia脚本 269
      • D.1.2 在Julia中运行R脚本 270
      • D.2 Julia与Python的集成 270
      • D.2.1 在Python中运行Julia脚本 270
      • D.2.2 在Julia中运行Python脚本 271
      • 附录E Julia中的并行处理 272
      • 附录F 各章思考题答案 275

      学习笔记

      python和julia学哪个

      Julia是一个面向科学计算的高性能动态高级程序设计语言。其语法与其他科学计算语言相似。在许多情况下拥有能与编译型语言相媲美的性能。Julia 是个灵活的动态语言,适合科学和数值计算,性能可与传统静态类型语言媲美。 一群拥有各种语言丰富编程经验的Matlab高级用户,对现有的科学计算编程工具感到不满——这些软件对自己专长的领域表现得非常棒,但在其它领域却非常糟糕。(推荐学习:Python视频教程) 他们想要的是一个开源的软件,它要像C语言一般快速而有拥有如同Ruby的动态性;要具有Lisp般真正的同像性(Homoiconicity)而又有Matlab般熟悉的数学记号;要像Python般通用、像R般在统计分析上……

      jqGrid表格应用之新增与删除数据附源码下载

      jqGrid可以结合fancybox等插件完成超酷的弹出层效果,通过与php后台交互,可以轻松完成数据的添加与详情查看,而这个过程完全是一个ajax异步通信过程,是一个非常友好的富客户端应用。 下面给大家展示了效果图,喜欢的朋友可以直接下载源码哦。 效果展示 源码下载 在上一篇文章中,我们提到过jqGrid自身有强大的单元格操作模块,但是这些模块操作起来不太适合用户的习惯,在本文中,我们使用fancybox,以及表单插件来完成jqGrid数据的添加以及删除操作。 XHTML 首先需要在head中引入相关js和css文件。 link rel="stylesheet" type="text/css" href="css/ui-lightness/jquery-ui-1.8.2.custom.css" / link rel="stylesheet" type="text/css" hre……

      vue.js实现数据动态响应 Vue.set的简单应用

      在vue里面,我们操作最多的就是各种数据,在jquery里面,我们习惯通过下标定向找到数据,然后重新赋值 比如var a[0]=111;(希望上家公司原谅菜鸟的我写了不少这样的代码) 下面上代码 html lang="en"head meta charset="UTF-8" titleDocument/title script src="./js/vue.min.js"/script/headbody div id="app" ul li v-for="item in listData"{{item}}/li /ul a href="javascript:void(0)" rel="external nofollow" rel="external nofollow" v-text="he" @click="changeData()"/a /div/bodyscript new Vue({ el:"#app", data:{ he:"点我", listData:["a","b","c"] }, methods:{ changeData () { this.listData[0]="d"; } } })/script/html 当我点击按钮时候,发现没有任何变化,页面上还是a,b,c vue当然不会这么菜呢 下面是伟大的vue内置的……

      Python利用pandas处理Excel数据的应用详解

      最近迷上了高效处理数据的pandas,其实这个是用来做数据分析的,如果你是做大数据分析和测试的,那么这个是非常的有用的!!但是其实我们平时在做自动化测试的时候,如果涉及到数据的读取和存储,那么而利用pandas就会非常高效,基本上3行代码可以搞定你20行代码的操作!该教程仅仅限于结合柠檬班的全栈自动化测试课程来讲解下pandas在项目中的应用,这仅仅只是冰山一角,希望大家可以踊跃的去尝试和探索! 一、安装环境: 1:pandas依赖处理Excel的xlrd模块,所以我们需要提前安装这个,安装命令是:pip install xlrd 2:安装pandas模块还需要一定的编码环境,所以我们自己在安装的时候,确保你的电……

      以上就是本次介绍的Julia电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:持续演进的Cloud Native:云原生架构下微服务最佳实践

      下一篇:HBase权威指南

      展开 +

      收起 -

      • 《Julia数据科学应用》PDF下载

      Julia相关电子书
      Julia语言程序设计
      Julia语言程序设计 扫描清晰版

      《Julia语言程序设计》 系统地介绍Julia编程语言的基本概念、各种功能、编程要点,包含大量示例代码以及编程技巧。 全书共16章。第1~2章介绍Julia语言的基本特点、基础概念。第3~4章介绍Jul

      立即下载
      精通MATLAB科学计算与数据统计应用
      精通MATLAB科学计算与数据统计应用 超清原版 立即下载
      Python和HDF5大数据应用
      Python和HDF5大数据应用 高质量中文版

      本书向任何有Python数据分析基本背景的人介绍如何在Python下使用HDF5。适合有基础的Python开发者,尤其适合要使用Python开发数据存储和处理等相关应用的读者阅读参考,感兴趣的小伙伴们可以下载参考一下

      立即下载
      大数据技术原理与应用
      大数据技术原理与应用 扫描第2版

      内容简介 (1) 概念篇:介绍当前紧密关联的IT领域技术云计算、大数据和物联网。 (2) 大数据存储与管理篇:介绍分布式数据存储的概念、原理和技术,包括HDFS、HBase、NoSQL数据库、云数据

      立即下载
      Hadoop大数据平台构建与应用
      Hadoop大数据平台构建与应用 完整影印版

      具有较强的实用性和可操作性,语言精练,通俗易懂,操作步骤描述详尽,并配有大量操作图例,感兴趣的可以下载学习

      立即下载
      大数据分析:R基础及应用
      大数据分析:R基础及应用 高清版

      在大数据时代,R以其强大的数据分析挖掘、可视化绘图等功能,越来越受到社会各个领域的青睐。现在,R的计算引擎、性能、程序包都得到了提升,其中R与大数据分析平台Hadoop的结合,实现

      立即下载
      数据挖掘与机器学习:WEKA应用技术与实践
      数据挖掘与机器学习:WEKA应用技术与实践 原书第二版

      本书过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,系统讲解Weka 3.7.13的操作、理论和应用,适合数据挖掘和机器学习相关人员作为技术参考书使用

      立即下载
      读者留言
      脚本之家

      脚本之家 提供上传

      资源
      48
      粉丝
      32
      喜欢
      242
      评论
      1

      Copyright 2018-2020 xz577.com 码农之家

      本站所有电子书资源不再提供下载地址,只分享来路

      版权投诉 / 书籍推广 / 赞助:QQ:520161757