
数据科学导论:Python语言实现 PDF 高清版
- 大小:30.2 MB
- 类型:Python
- 格式:PDF
- 热度:974
- 作者:阿尔贝托·博斯凯蒂
- 更新:2020-06-03 09:28:32

给大家整理了Python相关的资料,介绍了关于数据科学导论、Python语言方面,格式为PDF,资源大小30.2 MB,目前在Python类资源综合评分为:9.3分。
《数据科学导论:Python语言实现》 由两位资深数据科学家撰写,融合其多年从事数据科学相关的教学和科研工作经验,借助现有的Python语法和结构知识,全面而系统地讲解进行数据科学分析和开发的相关工具、技术和*佳实践,包含清晰的代码和简化的示例。通过阅读本书,你将深入理解Python核心概念,成为高效数据科学实践者。 本书共6章,系统介绍了进行数据科学分析和开发所涉及的关键要素。书中首先介绍Python软件及相关工具包的安装和使用;接着不仅讲解数据加载、运算和改写等基本数据准备过程,还详细介绍特征选择、维数约简等高级数据操作方法;并且建立了由训练、验证、测试等过程组成的数据科学流程,结合具体示例深入浅出地讲解了多种机器学习算法;然后介绍了基于图模型的社会网络创建、分析和处理方法;最后讲解数据分析结果的可视化及相关工具的使用方法。 目录 译者序 前言 第1章 新手上路1 1.1 数据科学与Python简介1 1.2 Python的安装2 1.2.1 Python 2还是Python 33 1.2.2 分步安装3 1.2.3 Python核心工具包一瞥4 1.2.4 工具包的安装7 1.2.5 工具包升级9 1.3 科学计算发行版9 1.3.1 Anaconda10 1.3.2 Enthought Canopy10 1.3.3 PythonXY10 1.3.4 WinPython10 1.4 IPython简介10 1.4.1 IPython Notebook12 1.4.2 本书使用的数据集和代码18 1.5 小结25 第2章 数据改写26 2.1 数据科学过程26 2.2 使用pandas进行数据加载与预处理27 2.2.1 数据快捷加载27 2.2.2 处理问题数据30 2.2.3 处理大数据集32 2.2.4 访问其他数据格式36 2.2.5 数据预处理37 2.2.6 数据选择39 2.3 使用分类数据和文本数据41 2.4 使用NumPy进行数据处理49 2.4.1 NumPy中的N维数组49 2.4.2 NumPy ndarray对象基础50 2.5 创建NumPy数组50 2.5.1 从列表到一维数组50 2.5.2 控制内存大小51 2.5.3 异构列表52 2.5.4 从列表到多维数组53 2.5.5 改变数组大小54 2.5.6 利用NumPy函数生成数组56 2.5.7 直接从文件中获得数组57 2.5.8 从pandas提取数据57 2.6 NumPy快速操作和计算58 2.6.1 矩阵运算60 2.6.2 NumPy数组切片和索引61 2.6.3 NumPy数组堆叠63 2.7 小结65 第3章 数据科学流程66 3.1 EDA简介66 3.2 特征创建70 3.3 维数约简72 3.3.1 协方差矩阵72 3.3.2 主成分分析73 3.3.3 一种用于大数据的PCA变型Randomized PCA76 3.3.4 潜在因素分析77 3.3.5 线性判别分析77 3.3.6 潜在语义分析78 3.3.7 独立成分分析78 3.3.8 核主成分分析78 3.3.9 受限玻耳兹曼机80 3.4 异常检测和处理81 3.4.1 单变量异常检测82 3.4.2 EllipticEnvelope83 3.4.3 OneClassSVM87 3.5 评分函数90 3.5.1 多标号分类90 3.5.2 二值分类92 3.5.3 回归93 3.6 测试和验证93 3.7 交叉验证97 3.7.1 使用交叉验证迭代器99 3.7.2 采样和自举方法100 3.8 超参数优化102 3.8.1 建立自定义评分函数104 3.8.2 减少网格搜索时间106 3.9 特征选择108 3.9.1 单变量选择108 3.9.2 递归消除110 3.9.3 稳定性选择与基于L1的选择111 3.10 小结112 第4章 机器学习113 4.1 线性和逻辑回归113 4.2 朴素贝叶斯116 4.3 K近邻118 4.4 高级非线性算法119 4.4.1 基于SVM的分类算法120 4.4.2 基于SVM的回归算法122 4.4.3 调整SVM123 4.5 组合策略124 4.5.1 基于随机样本的粘合策略125 4.5.2 基于弱组合的分袋策略125 4.5.3 随机子空间和随机分片126 4.5.4 模型序列AdaBoost127 4.5.5 梯度树提升128 4.5.6 处理大数据129 4.6 自然语言处理一瞥136 4.6.1 词语分词136 4.6.2 词干提取137 4.6.3 词性标注137 4.6.4 命名实体识别138 4.6.5 停止词139 4.6.6 一个完整的数据科学示例文本分类140 4.7 无监督学习概述141 4.8 小结146 第5章 社会网络分析147 5.1 图论简介147 5.2 图的算法152 5.3 图的加载、输出和采样157 5.4 小结160 第6章 可视化161 6.1 matplotlib基础介绍161 6.1.1 曲线绘图162 6.1.2 绘制分块图163 6.1.3 散点图164 6.1.4 直方图165 6.1.5 柱状图166 6.1.6 图像可视化167 6.2 pandas的几个图形示例169 6.2.1 箱线图与直方图170 6.2.2 散点图171 6.2.3 平行坐标173 6.3 高级数据学习表示174 6.3.1 学习曲线174 6.3.2 验证曲线176 6.3.3 特征重要性177 6.3.4 GBT部分依赖关系图179 6.4 小结180
相关资源
-
《Python少儿趣味编程》示例代码和练习解答
作者: 李强 ,李若瑜 编辑: 陈冀康 Python简易易懂,功能齐全,是儿童学习程序编写的优选語言。这书是儿童学习Python程序编写的趣味性手册,本书共17章,依照由简到难、逐渐深层次的方法机构各章內容。这书从了解Python刚开始,最先详细介绍了Python的安裝和IDLE的应用,随后先后详细介绍了自变量、大数字和字符串数组、目录、元组和词典、布尔类型等基本数据类型,及其标准、循环系统、出现异常和注解、涵数、面向对象编程、文档实际操作等基本
大小:21.2 MBPython编程配套资源
-
网络工程设计教程:系统集成方法 课后答案
《网络工程设计教程系统集成方法第二版》是2008年机械工业出版社出版的图书,作者是陈鸣。全书共274页。 本书以TCP/IP网络为蓝本、采用系统集成方法讲解网络工程设计与工程设计的方法及过程。本书以具有几台PC的小型局域网具有几十台到几百台PC的中型局域网覆盖个楼宇的网络覆盖几个楼宇的网络覆盖几个园区的网络为主线,将网络系统的基本概念、建设网络系统的基本方法以及网络设计领域的客观规律有机结合起来,并在每章最后通过网络工程案例
大小:3.75 MB网络工程课后答案
-
React学习之道:The Road to learn React
《React 学习之道》 会教您一些React 的基础知识。通过这套教程,您可以用纯React 构建一个真正可用的应用程序,而不需要去理会其他复杂的工具。我将为您逐一介绍从开发环境的准备到部署上线的全部过程。本书每一章都包含一些额外的索引资料以及课后练习。 在读完本书之后,您将会有能力依靠自己构建一个React 应用。我,Robin Wieruch,以及整个社区会持续维护和更新这些资料。通过《React 学习之道》,在开始陷入到更庞大的React 生态圈之前,我想为
大小:1.12 MBReact
-
计算机图形学基础(第2版) 课后答案
《计算机图形学基础(第2版)》是2011年电子工业出版社出版的图书,作者是陆枫、何云峰。 本书是普通高等教育十一五国家级规划教材。全书共分10章,第1章简单介绍计算机图形学的基本概念、应用和发展方向。第2~5章由外到内介绍计算机图形处理系统的硬件设备、人机交互处理、图形对象在计算机内的表示以及基本图素的生成算法等。第6章主要介绍二维变换和二维观察的概念。第7章介绍三维变换及三维观察的基本内容,包括几何变换和投影变换等
大小:439 KB计算机图形学课后答案
-
《MySQL从入门到精通》电子资源
编辑推荐 《MySQL从入门到精通》适合任何想学习MySQL的读者,无论您是否从事计算机相关行业,是否接触过MySQL,均可通过学习快速掌握MySQL的开发方法和技巧。 内容简介 《MySQL从入门到精通》以零基础讲解为宗旨,用实例引导读者学习,深入浅出地介绍了MySQL的相关知识和实战技能。《MySQL从入门到精通》第1篇【基础知识】主要讲解MySQL的安装与配置、MySQL数据库的基础知识、MySQL管理工具的使用以及数据库的基本操作等;第2篇【核心技术】主要讲解数据
大小:3.7 GBMySQL配套资源
-
百度离线人脸识别SDK及实例
最新版-百度离线人脸识别SDK及实例,支持离线识别,android平台
大小:232.5 MB人脸识别
-
信息管理原理与方法 课后答案
本书以现代管理科学原理为基础,信息科学理论和方法为工具,信息生命周期及其管理为主线,针对管理过程的信息学本质和特征,构建信息管理学的学科体系,联系企业信息管理的实际研究信息的收集、组织、存储、检索、传输、加工(变换)和利用的基本原理与方法,面向应用阐述信息管理的基本过程和方法,探讨信息安全问题与信息加密方法,探讨信息在科学决策中的价值,并在最后一章给出了几个典型的信息管理应用案例。本书在强调理论和方法
大小:2.42 MB信息管理课后答案
-
《无线网络故障诊断与排除大全(实例精华版)》配书资源
如今网络已经成为人们工作和生活中不可缺少的工具,随着笔记本、手机、平板等的普及,无线网络几乎与人们息息相关。不过由于无线网络的复杂性及这些高科技产品的技术非常复杂,导致在使用过程中经常会遇到无法联网、无法上网等问题。本书针对人们在使用无线网络的过程中遇到的各种问题进行了详细的总结和讲解,还就交换机故障、无线路由器故障、无线网卡和网络协议故障、无线组网故障等内容总结了大量的解决技巧,同时配合大量的经典
大小:4.8 MB无线网络故障配套资源
下载地址
相关声明: