当前位置:首页 > Python >
《数据科学导论:Python语言实现》电子书封面

数据科学导论:Python语言实现

  • 发布时间:2020年06月03日 09:28:32
  • 作者:阿尔贝托·博斯凯蒂
  • 大小:30.2 MB
  • 类别:Python电子书
  • 格式:PDF
  • 版本:高清版
  • 评分:8.8

    数据科学导论:Python语言实现 PDF 高清版

      给大家带来的一篇关于Python相关的电子书资源,介绍了关于数据科学导论、Python语言方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小30.2 MB,阿尔贝托·博斯凯蒂编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.1。

      内容介绍

      《数据科学导论:Python语言实现》由两位资深数据科学家撰写,融合其多年从事数据科学相关的教学和科研工作经验,借助现有的Python语法和结构知识,全面而系统地讲解进行数据科学分析和开发的相关工具、技术和*佳实践,包含清晰的代码和简化的示例。通过阅读本书,你将深入理解Python核心概念,成为高效数据科学实践者。

      本书共6章,系统介绍了进行数据科学分析和开发所涉及的关键要素。书中首先介绍Python软件及相关工具包的安装和使用;接着不仅讲解数据加载、运算和改写等基本数据准备过程,还详细介绍特征选择、维数约简等高级数据操作方法;并且建立了由训练、验证、测试等过程组成的数据科学流程,结合具体示例深入浅出地讲解了多种机器学习算法;然后介绍了基于图模型的社会网络创建、分析和处理方法;最后讲解数据分析结果的可视化及相关工具的使用方法。

      目录

      • 译者序
      • 前言
      • 第1章 新手上路1
      • 1.1 数据科学与Python简介1
      • 1.2 Python的安装2
      • 1.2.1 Python 2还是Python 33
      • 1.2.2 分步安装3
      • 1.2.3 Python核心工具包一瞥4
      • 1.2.4 工具包的安装7
      • 1.2.5 工具包升级9
      • 1.3 科学计算发行版9
      • 1.3.1 Anaconda10
      • 1.3.2 Enthought Canopy10
      • 1.3.3 PythonXY10
      • 1.3.4 WinPython10
      • 1.4 IPython简介10
      • 1.4.1 IPython Notebook12
      • 1.4.2 本书使用的数据集和代码18
      • 1.5 小结25
      • 第2章 数据改写26
      • 2.1 数据科学过程26
      • 2.2 使用pandas进行数据加载与预处理27
      • 2.2.1 数据快捷加载27
      • 2.2.2 处理问题数据30
      • 2.2.3 处理大数据集32
      • 2.2.4 访问其他数据格式36
      • 2.2.5 数据预处理37
      • 2.2.6 数据选择39
      • 2.3 使用分类数据和文本数据41
      • 2.4 使用NumPy进行数据处理49
      • 2.4.1 NumPy中的N维数组49
      • 2.4.2 NumPy ndarray对象基础50
      • 2.5 创建NumPy数组50
      • 2.5.1 从列表到一维数组50
      • 2.5.2 控制内存大小51
      • 2.5.3 异构列表52
      • 2.5.4 从列表到多维数组53
      • 2.5.5 改变数组大小54
      • 2.5.6 利用NumPy函数生成数组56
      • 2.5.7 直接从文件中获得数组57
      • 2.5.8 从pandas提取数据57
      • 2.6 NumPy快速操作和计算58
      • 2.6.1 矩阵运算60
      • 2.6.2 NumPy数组切片和索引61
      • 2.6.3 NumPy数组堆叠63
      • 2.7 小结65
      • 第3章 数据科学流程66
      • 3.1 EDA简介66
      • 3.2 特征创建70
      • 3.3 维数约简72
      • 3.3.1 协方差矩阵72
      • 3.3.2 主成分分析73
      • 3.3.3 一种用于大数据的PCA变型—Randomized PCA76
      • 3.3.4 潜在因素分析77
      • 3.3.5 线性判别分析77
      • 3.3.6 潜在语义分析78
      • 3.3.7 独立成分分析78
      • 3.3.8 核主成分分析78
      • 3.3.9 受限玻耳兹曼机80
      • 3.4 异常检测和处理81
      • 3.4.1 单变量异常检测82
      • 3.4.2 EllipticEnvelope83
      • 3.4.3 OneClassSVM87
      • 3.5 评分函数90
      • 3.5.1 多标号分类90
      • 3.5.2 二值分类92
      • 3.5.3 回归93
      • 3.6 测试和验证93
      • 3.7 交叉验证97
      • 3.7.1 使用交叉验证迭代器99
      • 3.7.2 采样和自举方法100
      • 3.8 超参数优化102
      • 3.8.1 建立自定义评分函数104
      • 3.8.2 减少网格搜索时间106
      • 3.9 特征选择108
      • 3.9.1 单变量选择108
      • 3.9.2 递归消除110
      • 3.9.3 稳定性选择与基于L1的选择111
      • 3.10 小结112
      • 第4章 机器学习113
      • 4.1 线性和逻辑回归113
      • 4.2 朴素贝叶斯116
      • 4.3 K近邻118
      • 4.4 高级非线性算法119
      • 4.4.1 基于SVM的分类算法120
      • 4.4.2 基于SVM的回归算法122
      • 4.4.3 调整SVM123
      • 4.5 组合策略124
      • 4.5.1 基于随机样本的粘合策略125
      • 4.5.2 基于弱组合的分袋策略125
      • 4.5.3 随机子空间和随机分片126
      • 4.5.4 模型序列—AdaBoost127
      • 4.5.5 梯度树提升128
      • 4.5.6 处理大数据129
      • 4.6 自然语言处理一瞥136
      • 4.6.1 词语分词136
      • 4.6.2 词干提取137
      • 4.6.3 词性标注137
      • 4.6.4 命名实体识别138
      • 4.6.5 停止词139
      • 4.6.6 一个完整的数据科学示例—文本分类140
      • 4.7 无监督学习概述141
      • 4.8 小结146
      • 第5章 社会网络分析147
      • 5.1 图论简介147
      • 5.2 图的算法152
      • 5.3 图的加载、输出和采样157
      • 5.4 小结160
      • 第6章 可视化161
      • 6.1 matplotlib基础介绍161
      • 6.1.1 曲线绘图162
      • 6.1.2 绘制分块图163
      • 6.1.3 散点图164
      • 6.1.4 直方图165
      • 6.1.5 柱状图166
      • 6.1.6 图像可视化167
      • 6.2 pandas的几个图形示例169
      • 6.2.1 箱线图与直方图170
      • 6.2.2 散点图171
      • 6.2.3 平行坐标173
      • 6.3 高级数据学习表示174
      • 6.3.1 学习曲线174
      • 6.3.2 验证曲线176
      • 6.3.3 特征重要性177
      • 6.3.4 GBT部分依赖关系图179
      • 6.4 小结180

      学习笔记

      python怎么爬取数据

      在学习python的过程中,学会获取网站的内容是我们必须要掌握的知识和技能,今天就分享一下爬虫的基本流程,只有了解了过程,我们再慢慢一步步的去掌握它所包含的知识 Python网络爬虫大概需要以下几个步骤: 一、获取网站的地址 有些网站的网址十分的好获取,显而易见,但是有些网址需要我们在浏览器中经过分析得出 二、获取网站的地址 有些网站的网址十分的好获取,显而易见,但是有些网址需要我们在浏览器中经过分析得出 三、请求 url 主要是为了获取我们所需求的网址的源码,便于我们获取数据 四、获取响应 获取响应是十分重要的, 我们只有获取了响应才可以对网站的内容进行提取,必……

      利用python操作SQLite数据库及文件操作详解

      前言 最近在工作中遇到一个需求,就是要把SQLite数据中没有存储的文件名的文件删除掉,想来想去还是决定用python。所以也就花了一天半的时间学习了下,随手写了个小例子,下面话不多说了,感兴趣的朋友们一起来看看详细的介绍吧。 直接上代码 要用到的头文件包 #coding=utf-8#!/usr/bin/python#!/usr/bin/env pythonimport osimport shutilimport sqlite3 定义记录变量 #记录所文件数sumCount=0;#记录留存文件数count=0;#记录删除文件数delCount=0;#定义存储遍历所有文件数组delList = [] #文件存储路径delDir = "/Users/liudengtan/Desktop/testFile/"#获取路径下所有文件delList = os.listdir(delDir)#打开连接数据库conn = sqlite3.connect('images.db')print "开始处理……

      python3 json数据格式的转换(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互转换)

      python3 json数据格式的转换(dumps/loads的使用、dict to str/str to dict、json字符串/字典的相互转换) Python3 JSON 数据解析 JSON (JavaScript Object Notation) 是一种轻量级的数据交换格式。它基于ECMAScript的一个子集。 Python3 中可以使用 json 模块来对 JSON 数据进行编解码,它包含了两个函数: json.dumps(): 对数据进行编码。 json.loads(): 对数据进行解码。 在写网络爬虫的时候,有时候会抓取到一些json格式的字符串,想要通过python字典的方式对字串中的内容进行寻址,则需要将json字符串先转换为python字典。 dumps()函数: loads()函数: 示例: import jsonclass forDatas: def __init__(self): pass def testJson(self): # 定义一个字典 d = {'a': 1, 'b': ……

      python之从文件读取数据到list的实例讲解

      背景: 文件内容每一行是由N个单一数字组成的,每个数字之间由制表符区分,比如: 0 4 3 1 2 2 1 0 3 1 2 0 …… 现在需要将每一行数据存为一个list,然后所有行组成一个大的list 工具: 1.strip():用于移除字符串头尾指定的字符,默认为空格,返回是字符串 2.split():通过指定分隔符对字符串进行切片,返回是字符串组成的list 实例: #!/usr/bin/python #coding=utf-8 def readfile(filename): with open(filename,'r') as f: for line in f.readlines(): linestr = line.strip() print linestr linestrlist = linestr.split("\t") print linestrlist linelist = map(int,linestrlist)# 方法一 # linelist = [int(i) for i in linestrlist] # 方法二 print linelist 以上这篇python之从文件读取数据到li……

      用Python将Excel数据导入到SQL Server的例子

      使用环境:Win10 x64 Python:3.6.4 SqlServer:2008R2 因为近期需要将excel导入到SQL Server,但是使用的是其他语言,闲来无事就尝试着用python进行导入,速度还是挺快的,1w多条数据,也只用了1s多,代码也比较简单,就不多解释了。 用到的库有xlrd(用来处理excel),pymssql(用来连接使用sql server) import xlrdimport pymssqlimport datetime# 连接本地sql server 地址 用户名 密码 数据库conn = pymssql.connect("127.0.0.1:1433", "sa", "888888", "Test")# 建立cursorcursor = conn.cursor()# excel文件fname = "XXXX.xls"#打开文件bk = xlrd.open_workbook(fname)#打开工作表sh = bk.sheets()[0]#获取行数start_time=datetime.datetime.now()sql3=''# 遍历所有行for i in range(1,sh.nrows): a = [] sql = '(' # 遍……

      以上就是本次介绍的Python电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:计算机图形学

      下一篇:网络是怎样连接的

      展开 +

      收起 -

      • 《数据科学导论:Python语言实现》PDF下载

      下载地址:百度网盘下载
      Python相关电子书
      Python金融数据分析
      Python金融数据分析 清晰版 立即下载
      Python数据科学指南
      Python数据科学指南 清晰扫描版

      本书是Python数据分析编程入门,详细介绍了Python在数据科学中的应用,60多个实用的开发技巧,帮你探索Python及其强大的数据科学能力

      立即下载
      利用Python进行数据分析
      利用Python进行数据分析 完整第2版

      本书涵盖大量具体的实践建议,以及大量综合应用方法,教大家如何利用各种Python库高效地解决各式各样的数据分析问题,这里提供利用Python进行数据分析英文原版下载,附件集合了第二版英文原文、第二版的笔记精要、以及第二版原书的代码

      立即下载
      从Excel到Python:数据分析进阶指南
      从Excel到Python:数据分析进阶指南 高清版

      Excel是数据分析中最常用的工具,本书通过Python与Excel的功能对比介绍如何使用Python通过函数式编程完成Excel中的数据处理及分析工作。在Python中pandas库用于数据处理,我们从1787页的pandas官网文

      立即下载
      零起点Python足彩大数据与机器学习实盘分析
      零起点Python足彩大数据与机器学习实盘分析 全书影印版 立即下载
      跟老齐学Python:数据分析
      跟老齐学Python:数据分析 超清完整版 立即下载
      基于Python的大数据分析基础及实战
      基于Python的大数据分析基础及实战 高质量版

      配套设施教程视频教你如何学Python 提炼出避坑技能招式简要、高效率懂Python 实战演练经典案例轻轻松松、迅速玩Python 解读实践活动实例视頻源码源统计数据 对于Python初学者量身订做,新手入

      立即下载
      Python数据分析与应用
      Python数据分析与应用 内部全资料版 立即下载
      读者留言
      姜文博

      姜文博 提供上传

      资源
      46
      粉丝
      22
      喜欢
      69
      评论
      11

      Copyright 2018-2020 www.xz577.com 码农之家

      投诉 / 推广 / 赞助:QQ:520161757