反馈 / 投诉
-
数据科学导论:Python语言实现 PDF 高清版
2020-06-03 09:28:32 类别:Python
-
扫二维码手机浏览
资源介绍
给网友朋友们带来一篇Python相关的 PDF电子书资料,由机械工业出版社出版,作者是阿尔贝托·博斯凯蒂,介绍了关于数据科学导论、Python语言方面,格式为PDF,资源大小30.2 MB,目前在Python类资源综合评分为:7.5分。
《数据科学导论:Python语言实现》由两位资深数据科学家撰写,融合其多年从事数据科学相关的教学和科研工作经验,借助现有的Python语法和结构知识,全面而系统地讲解进行数据科学分析和开发的相关工具、技术和*佳实践,包含清晰的代码和简化的示例。通过阅读本书,你将深入理解Python核心概念,成为高效数据科学实践者。
本书共6章,系统介绍了进行数据科学分析和开发所涉及的关键要素。书中首先介绍Python软件及相关工具包的安装和使用;接着不仅讲解数据加载、运算和改写等基本数据准备过程,还详细介绍特征选择、维数约简等高级数据操作方法;并且建立了由训练、验证、测试等过程组成的数据科学流程,结合具体示例深入浅出地讲解了多种机器学习算法;然后介绍了基于图模型的社会网络创建、分析和处理方法;最后讲解数据分析结果的可视化及相关工具的使用方法。
目录
- 译者序
- 前言
- 第1章 新手上路1
- 1.1 数据科学与Python简介1
- 1.2 Python的安装2
- 1.2.1 Python 2还是Python 33
- 1.2.2 分步安装3
- 1.2.3 Python核心工具包一瞥4
- 1.2.4 工具包的安装7
- 1.2.5 工具包升级9
- 1.3 科学计算发行版9
- 1.3.1 Anaconda10
- 1.3.2 Enthought Canopy10
- 1.3.3 PythonXY10
- 1.3.4 WinPython10
- 1.4 IPython简介10
- 1.4.1 IPython Notebook12
- 1.4.2 本书使用的数据集和代码18
- 1.5 小结25
- 第2章 数据改写26
- 2.1 数据科学过程26
- 2.2 使用pandas进行数据加载与预处理27
- 2.2.1 数据快捷加载27
- 2.2.2 处理问题数据30
- 2.2.3 处理大数据集32
- 2.2.4 访问其他数据格式36
- 2.2.5 数据预处理37
- 2.2.6 数据选择39
- 2.3 使用分类数据和文本数据41
- 2.4 使用NumPy进行数据处理49
- 2.4.1 NumPy中的N维数组49
- 2.4.2 NumPy ndarray对象基础50
- 2.5 创建NumPy数组50
- 2.5.1 从列表到一维数组50
- 2.5.2 控制内存大小51
- 2.5.3 异构列表52
- 2.5.4 从列表到多维数组53
- 2.5.5 改变数组大小54
- 2.5.6 利用NumPy函数生成数组56
- 2.5.7 直接从文件中获得数组57
- 2.5.8 从pandas提取数据57
- 2.6 NumPy快速操作和计算58
- 2.6.1 矩阵运算60
- 2.6.2 NumPy数组切片和索引61
- 2.6.3 NumPy数组堆叠63
- 2.7 小结65
- 第3章 数据科学流程66
- 3.1 EDA简介66
- 3.2 特征创建70
- 3.3 维数约简72
- 3.3.1 协方差矩阵72
- 3.3.2 主成分分析73
- 3.3.3 一种用于大数据的PCA变型—Randomized PCA76
- 3.3.4 潜在因素分析77
- 3.3.5 线性判别分析77
- 3.3.6 潜在语义分析78
- 3.3.7 独立成分分析78
- 3.3.8 核主成分分析78
- 3.3.9 受限玻耳兹曼机80
- 3.4 异常检测和处理81
- 3.4.1 单变量异常检测82
- 3.4.2 EllipticEnvelope83
- 3.4.3 OneClassSVM87
- 3.5 评分函数90
- 3.5.1 多标号分类90
- 3.5.2 二值分类92
- 3.5.3 回归93
- 3.6 测试和验证93
- 3.7 交叉验证97
- 3.7.1 使用交叉验证迭代器99
- 3.7.2 采样和自举方法100
- 3.8 超参数优化102
- 3.8.1 建立自定义评分函数104
- 3.8.2 减少网格搜索时间106
- 3.9 特征选择108
- 3.9.1 单变量选择108
- 3.9.2 递归消除110
- 3.9.3 稳定性选择与基于L1的选择111
- 3.10 小结112
- 第4章 机器学习113
- 4.1 线性和逻辑回归113
- 4.2 朴素贝叶斯116
- 4.3 K近邻118
- 4.4 高级非线性算法119
- 4.4.1 基于SVM的分类算法120
- 4.4.2 基于SVM的回归算法122
- 4.4.3 调整SVM123
- 4.5 组合策略124
- 4.5.1 基于随机样本的粘合策略125
- 4.5.2 基于弱组合的分袋策略125
- 4.5.3 随机子空间和随机分片126
- 4.5.4 模型序列—AdaBoost127
- 4.5.5 梯度树提升128
- 4.5.6 处理大数据129
- 4.6 自然语言处理一瞥136
- 4.6.1 词语分词136
- 4.6.2 词干提取137
- 4.6.3 词性标注137
- 4.6.4 命名实体识别138
- 4.6.5 停止词139
- 4.6.6 一个完整的数据科学示例—文本分类140
- 4.7 无监督学习概述141
- 4.8 小结146
- 第5章 社会网络分析147
- 5.1 图论简介147
- 5.2 图的算法152
- 5.3 图的加载、输出和采样157
- 5.4 小结160
- 第6章 可视化161
- 6.1 matplotlib基础介绍161
- 6.1.1 曲线绘图162
- 6.1.2 绘制分块图163
- 6.1.3 散点图164
- 6.1.4 直方图165
- 6.1.5 柱状图166
- 6.1.6 图像可视化167
- 6.2 pandas的几个图形示例169
- 6.2.1 箱线图与直方图170
- 6.2.2 散点图171
- 6.2.3 平行坐标173
- 6.3 高级数据学习表示174
- 6.3.1 学习曲线174
- 6.3.2 验证曲线176
- 6.3.3 特征重要性177
- 6.3.4 GBT部分依赖关系图179
- 6.4 小结180
以上就是本次关于书籍资源的介绍和部分内容,我们还整理了以往更新的其它相关电子书资源内容,可以在下方直接下载,关于相关的资源我们在下方做了关联展示,需要的朋友们也可以参考下。
下载地址
下载地址:网盘下载
Python相关资源
学习心得
欢迎发表评论:
- 最新更新
-
1
Java编程实战宝典 PDF电子书
类别:Java编程
-
2
自然语言处理原理与技术实现 PDF电子书
类别:自然语言
-
3
Vert.x应用开发实例教程 PDF电子书
类别:Vert.x
-
4
深入理解php:高级技巧、面向对象与核心技术(第3版) PDF电子书
类别:php
-
5
PHP经典实例(第3版) PDF电子书
类别:PHP实例
-
6
Django开发宝典 PDF电子书
类别:Django
-
7
Learning PHP设计模式 PDF电子书
类别:PHP编程
-
8
Java高并发编程详解:多线程与架构设计 PDF电子书
类别:Java编程
-
9
教孩子学编程:Python语言版 PDF电子书
类别:儿童编程
- 资料推荐
-
- 05-11嵌入式系统设计与开发实践 PDF电子书
- 04-27机器人学导论(原书第3版) 课后答案
- 11-27《Visual Basic程序设计基础(第2版)》源代码,教案
- 07-10系统运维全面解析:技术、管理与实践 PDF电子书
- 11-15react快速上手开发 PDF电子书
- 12-15《网页设计与制作》源代码,习题,课件
- 12-08汇编语言教程大全合集 编程资源
- 04-18Python正则表达式全套笔记(含Python3.10官方文档) 编程资源
- 07-06Docker开发指南 PDF电子书
- 09-29《Photoshop修饰与合成专业技法》配套资源
python怎么爬取数据
在学习python的过程中,学会获取网站的内容是我们必须要掌握的知识和技能,今天就分享一下爬虫的基本流程,只有了解了过程,我们再慢慢一步步的去掌握它所包含的知识 Python网络爬虫大概需要以下几个步骤: 一、获取网站的地址 有些网站的网址十分的好获取,显而易见,但是有些网址需要我们在浏览器中经过分析得出 二、获取网站的地址 有些网站的网址十分的好获取,显……
利用python操作SQLite数据库及文件操作详解
前言 最近在工作中遇到一个需求,就是要把SQLite数据中没有存储的文件名的文件删除掉,想来想去还是决定用python。所以也就花了一天半的时间学习了下,随手写了个小例子,下面话不多说了,感兴趣的朋友们一起来看看详细的介绍吧。 直接上代码 要用到的头文件包 #coding=utf-8#!/usr/bin/python#!/usr/bin/env pythonimport osimport shutilimport sqlite3 定义记录变量 #记录所文件数sumCount=0;#记录留……
python3 json数据格式的转换(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互转换)
python3 json数据格式的转换(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互转换) Python3 JSON 数据解析 JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数: json.dumps(): 对数据进行编码。 json.loads(): 对数据进行解码。 在写网络爬虫的时候,有时候会抓取到一些js……
python之从文件读取数据到list的实例讲解
背景: 文件内容每一行是由N个单一数字组成的,每个数字之间由制表符区分,比如: 0 4 3 1 2 2 1 0 3 1 2 0 …… 现在需要将每一行数据存为一个list,然后所有行组成一个大的list 工具: 1.strip():用于移除字符串头尾指定的字符,默认为空格,返回是字符串 2.split():通过指定分隔符对字符串进行切片,返回是字符串组成的list 实例: #!/usr/bin/python #coding=utf-8 def readfile(filename): with o……
用Python将Excel数据导入到SQL Server的例子
使用环境:Win10 x64 Python:3.6.4 SqlServer:2008R2 因为近期需要将excel导入到SQL Server,但是使用的是其他语言,闲来无事就尝试着用python进行导入,速度还是挺快的,1w多条数据,也只用了1s多,代码也比较简单,就不多解释了。 用到的库有xlrd(用来处理excel),pymssql(用来连接使用sql server) import xlrdimport pymssqlimport datetime# 连接本地sql server 地址 用户名 密码 数据库conn = pymssql.connect("127.……