标签分类 热门分类
当前位置:首页 > 程序设计电子书 > Python数据电子书网盘下载
Python数据分析与应用 Python数据分析与应用
psearch

psearch 提供上传

资源
34
粉丝
48
喜欢
577
评论
19

    Python数据分析与应用 PDF 内部全资料版

    Python数据电子书
    • 发布时间:

    给大家带来的一篇关于Python数据相关的电子书资源,介绍了关于Python方面的内容,本书是由人民邮电出版社出版,格式为PDF,资源大小281 MB,黄红梅 张良均编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.6,更多相关的学习资源可以参阅 程序设计电子书Python电子书、等栏目。

    Python数据分析与应用 PDF 下载

    下载地址:https://pan.baidu.com/s/162FnN7bATAwCbf0zUdyrf

    分享码:hdo7

    Python数据分析与应用 PDF

    这书选用了以每日任务为导向性的教学方式,依照处理具体每日任务的工作内容线路,逐渐进行详细介绍有关的基础理论知识结构图,计算转化成行得通的解决方法,* 后贯彻落实在每日任务保持阶段。 本书绝大多数章节目录围绕每日任务要求进行,不沉积知识结构图,侧重于解决困难时构思的启迪与计划方案的执行。根据从每日任务要求到保持这一详细工作内容的感受,协助用户真实了解与消化吸收Python数据统计分析与运用。 书中实例所有来源于公司真正新项目,可执行性强,正确引导用户融汇贯通,并出示源码等有关教学资源,协助用户迅速把握互联网大数据有关专业技能。这书以每日任务为导向性,全方位地详细介绍数据统计分析的步骤和Python数据统计分析库的运用,详尽解读运用Python处理公司具体难题的方式 。本书共9章,* 1章详细介绍了数据统计分析的基本要素等有关专业知识;* 2~6章详细介绍了Python数据统计分析的常见库以及运用,包含NumPy数值计算、Matplotlib大数据可视化、pandas数据分析、应用pandas开展数据预处理、应用scikit-learn搭建实体模型,比较全方位地论述了Python数据分析方法;第7~9章融合以前所教的数据统计分析技术性,开展公司综合性实例数据统计分析。除* 1章外,这书各章都包括了培训与课后练习练习题,根据训练和实际操作实践活动,协助用户推进所教的內容。 这书可做为高等院校云计算技术类技术专业的教材内容,还可以做为云计算技术发烧友的自学用书。

    目录

    • 第1章 Python数据分析概述 1
    • 任务1.1 认识数据分析 1
    • 1.1.1 掌握数据分析的概念 2
    • 1.1.2 掌握数据分析的流程 2
    • 1.1.3 了解数据分析应用场景 4
    • 任务1.2 熟悉Python数据分析的工具 5
    • 1.2.1 了解数据分析常用工具 6
    • 1.2.2 了解Python数据分析的优势 7
    • 1.2.3 了解Python数据分析常用类库 7
    • 任务1.3 安装Python的Anaconda发行版 9
    • 1.3.1 了解Python的Anaconda发行版 9
    • 1.3.2 在Windows系统中安装Anaconda 9
    • 1.3.3 在Linux系统中安装Anaconda 12
    • 任务1.4 掌握Jupyter Notebook常用功能 14
    • 1.4.1 掌握Jupyter Notebook的基本功能 14
    • 1.4.2 掌握Jupyter Notebook的高 级功能 16
    • 小结 19
    • 课后习题 19
    • 第2章 NumPy数值计算基础 21
    • 任务2.1 掌握NumPy数组对象ndarray 21
    • 2.1.1 创建数组对象 21
    • 2.1.2 生成随机数 27
    • 2.1.3 通过索引访问数组 29
    • 2.1.4 变换数组的形态 31
    • 任务2.2 掌握NumPy矩阵与通用函数 34
    • 2.2.1 创建NumPy矩阵 34
    • 2.2.2 掌握ufunc函数 37
    • 任务2.3 利用NumPy进行统计分析 41
    • 2.3.1 读/写文件 41
    • 2.3.2 使用函数进行简单的统计分析 44
    • 2.3.3 任务实现 48
    • 小结 50
    • 实训 50
    • 实训1 创建数组并进行运算 50
    • 实训2 创建一个国际象棋的棋盘 50
    • 课后习题 51
    • 第3章 Matplotlib数据可视化基础 52
    • 任务3.1 掌握绘图基础语法与常用参数 52
    • 3.1.1 掌握pyplot基础语法 53
    • 3.1.2 设置pyplot的动态rc参数 56
    • 任务3.2 分析特征间的关系 59
    • 3.2.1 绘制散点图 59
    • 3.2.2 绘制折线图 62
    • 3.2.3 任务实现 65
    • 任务3.3 分析特征内部数据分布与分散状况 68
    • 3.3.1 绘制直方图 68
    • 3.3.2 绘制饼图 70
    • 3.3.3 绘制箱线图 71
    • 3.3.4 任务实现 73
    • 小结 77
    • 实训 78
    • 实训1 分析1996~2015年人口数据特征间的关系 78
    • 实训2 分析1996~2015年人口数据各个特征的分布与分散状况 78
    • 课后习题 79
    • 第4章 pandas统计分析基础 80
    • 任务4.1 读/写不同数据源的数据 80
    • 4.1.1 读/写数据库数据 80
    • 4.1.2 读/写文本文件 83
    • 4.1.3 读/写Excel文件 87
    • 4.1.4 任务实现 88
    • 任务4.2 掌握DataFrame的常用操作 89
    • 4.2.1 查看DataFrame的常用属性 89
    • 4.2.2 查改增删DataFrame数据 91
    • 4.2.3 描述分析DataFrame数据 101
    • 4.2.4 任务实现 104
    • 任务4.3 转换与处理时间序列数据 107
    • 4.3.1 转换字符串时间为标准时间 107
    • 4.3.2 提取时间序列数据信息 109
    • 4.3.3 加减时间数据 110
    • 4.3.4 任务实现 111
    • 任务4.4 使用分组聚合进行组内计算 113
    • 4.4.1 使用groupby方法拆分数据 114
    • 4.4.2 使用agg方法聚合数据 116
    • 4.4.3 使用apply方法聚合数据 119
    • 4.4.4 使用transform方法聚合数据 121
    • 4.4.5 任务实现 121
    • 任务4.5 创建透视表与交叉表 123
    • 4.5.1 使用pivot_table函数创建透视表 123
    • 4.5.2 使用crosstab函数创建交叉表 127
    • 4.5.3 任务实现 128
    • 小结 130
    • 实训 130
    • 实训1 读取并查看P2P网络贷款数据主表的基本信息 130
    • 实训2 提取用户信息更新表和登录信息表的时间信息 130
    • 实训3 使用分组聚合方法进一步分析用户信息更新表和登录信息表 131
    • 实训4 对用户信息更新表和登录信息表进行长宽表转换 131
    • 课后习题 131
    • 第5章 使用pandas进行数据预处理 133
    • 任务5.1 合并数据 133
    • 5.1.1 堆叠合并数据 133
    • 5.1.2 主键合并数据 136
    • 5.1.3 重叠合并数据 139
    • 5.1.4 任务实现 140
    • 任务5.2 清洗数据 141
    • 5.2.1 检测与处理重复值 141
    • 5.2.2 检测与处理缺失值 146
    • 5.2.3 检测与处理异常值 149
    • 5.2.4 任务实现 152
    • 任务5.3 标准化数据 154
    • 5.3.1 离差标准化数据 154
    • 5.3.2 标准差标准化数据 155
    • 5.3.3 小数定标标准化数据 156
    • 5.3.4 任务实现 157
    • 任务5.4 转换数据 158
    • 5.4.1 哑变量处理类别型数据 158
    • 5.4.2 离散化连续型数据 160
    • 5.4.3 任务实现 162
    • 小结 163
    • 实训 164
    • 实训1 插补用户用电量数据缺失值 164
    • 实训2 合并线损、用电量趋势与线路告警数据 164
    • 实训3 标准化建模专家样本数据 164
    • 课后习题 165
    • 第6章 使用scikit-learn构建模型 167
    • 任务6.1 使用sklearn转换器处理数据 167
    • 6.1.1 加载datasets模块中的数据集 167
    • 6.1.2 将数据集划分为训练集和测试集 170
    • 6.1.3 使用sklearn转换器进行数据预处理与降维 172
    • 6.1.4 任务实现 174
    • 任务6.2 构建并评价聚类模型 176
    • 6.2.1 使用sklearn估计器构建聚类模型 176
    • 6.2.2 评价聚类模型 179
    • 6.2.3 任务实现 182
    • 任务6.3 构建并评价分类模型 183
    • 6.3.1 使用sklearn估计器构建分类模型 183
    • 6.3.2 评价分类模型 186
    • 6.3.3 任务实现 188
    • 任务6.4 构建并评价回归模型 190
    • 6.4.1 使用sklearn估计器构建线性回归模型 190
    • 6.4.2 评价回归模型 193
    • 6.4.3 任务实现 194
    • 小结 196
    • 实训 196
    • 实训1 使用sklearn处理wine和wine_quality数据集 196
    • 实训2 构建基于wine数据集的K-Means聚类模型 196
    • 实训3 构建基于wine数据集的SVM分类模型 197
    • 实训4 构建基于wine_quality数据集的回归模型 197
    • 课后习题 198
    • 第7章 航空公司客户价值分析 199
    • 任务7.1 了解航空公司现状与客户价值分析 199
    • 7.1.1 了解航空公司现状 200
    • 7.1.2 认识客户价值分析 201
    • 7.1.3 熟悉航空客户价值分析的步骤与流程 201
    • 任务7.2 预处理航空客户数据 202
    • 7.2.1 处理数据缺失值与异常值 202
    • 7.2.2 构建航空客户价值分析关键特征 202
    • 7.2.3 标准化LRFMC模型的5个特征 206
    • 7.2.4 任务实现 207
    • 任务7.3 使用K-Means算法进行客户分群 209
    • 7.3.1 了解K-Means聚类算法 209
    • 7.3.2 分析聚类结果 210
    • 7.3.3 模型应用 213
    • 7.3.4 任务实现 214
    • 小结 215
    • 实训 215
    • 实训1 处理信用卡数据异常值 215
    • 实训2 构造信用卡客户风险评价关键特征 217
    • 实训3 构建K-Means聚类模型 218
    • 课后习题 218
    • 第8章 财政收入预测分析 220
    • 任务8.1 了解财政收入预测的背景与方法 220
    • 8.1.1 分析财政收入预测背景 220
    • 8.1.2 了解财政收入预测的方法 222
    • 8.1.3 熟悉财政收入预测的步骤与流程 223
    • 任务8.2 分析财政收入数据特征的相关性 223
    • 8.2.1 了解相关性分析 223
    • 8.2.2 分析计算结果 224
    • 8.2.3 任务实现 225
    • 任务8.3 使用Lasso回归选取财政收入预测的关键特征 225
    • 8.3.1 了解Lasso回归方法 226
    • 8.3.2 分析Lasso回归结果 227
    • 8.3.3 任务实现 227
    • 任务8.4 使用灰色预测和SVR构建财政收入预测模型 228
    • 8.4.1 了解灰色预测算法 228
    • 8.4.2 了解SVR算法 229
    • 8.4.3 分析预测结果 232
    • 8.4.4 任务实现 234
    • 小结 236
    • 实训 236
    • 实训1 求取企业所得税各特征间的相关系数 236
    • 实训2 选取企业所得税预测关键特征 237
    • 实训3 构建企业所得税预测模型 237
    • 课后习题 237
    • 第9章 家用热水器用户行为分析与事件识别 239
    • 任务9.1 了解家用热水器用户行为分析的背景与步骤 239
    • 9.1.1 分析家用热水器行业现状 240
    • 9.1.2 了解热水器采集数据基本情况 240
    • 9.1.3 熟悉家用热水器用户行为分析的步骤与流程 241
    • 任务9.2 预处理热水器用户用水数据 242
    • 9.2.1 删除冗余特征 242
    • 9.2.2 划分用水事件 243
    • 9.2.3 确定单次用水事件时长阈值 244
    • 9.2.4 任务实现 246
    • 任务9.3 构建用水行为特征并筛选用水事件 247
    • 9.3.1 构建用水时长与频率特征 248
    • 9.3.2 构建用水量与波动特征 249
    • 9.3.3 筛选候选洗浴事件 250
    • 9.3.4 任务实现 251
    • 任务9.4 构建行为事件分析的BP神经网络模型 255
    • 9.4.1 了解BP神经网络算法原理 255
    • 9.4.2 构建模型 259
    • 9.4.3 评估模型 260
    • 9.4.4 任务实现 260
    • 小结 263
    • 实训 263
    • 实训1 清洗运营商客户数据 263
    • 实训2 筛选客户运营商数据 264
    • 实训3 构建神经网络预测模型 265
    • 课后习题 265
    • 附录A 267
    • 附录B 270
    • 参考文献 295

    上一篇:运营有道:重新定义互联网运营  下一篇:机器学习之路:Caffe、Keras、scikit-learn实战

    展开 +

    收起 -

    Python数据 相关电子书
    关于Python数据的学习笔记
    网友NO.671426

    python数据分析用什么编译器

    Jupyter Notebook(此前被称为 IPython notebook)是一个交互式笔记本,支持运行 40 多种编程语言。 Jupyter Notebook 的本质是一个 Web 应用程序,便于创建和共享文学化程序文档,支持实时代码,数学方程,可视化和 markdown。 用途包括:数据清理和转换,数值模拟,统计建模,机器学习等等 。 定义 (推荐学习:Python视频教程) 用户可以通过电子邮件,Dropbox,GitHub 和 Jupyter Notebook Viewer,将 Jupyter Notebook 分享给其他人。 在Jupyter Notebook 中,代码可以实时的生成图像,视频,LaTeX和JavaScript。 使用 数据挖掘领域中最热门的比赛 Kaggle 里的资料都是Jupyter 格式 。 架构 Jupyter组件 Jupyter包含以下组件: Jupyter Notebook 和 Notebook 文件格式 Jupyter Qt 控制台 内核消息协议 (kernel messaging protocol) 许多其他组件 内核 Jupyter Notebook 与 IPython终端 共享同一个内核 [3] 。 内核进程可以同时连接到多个前端。 在这种情况下,不同的前端访问的是同一个变量。 这个设计可以满足以下两种需求: 相同内核不同前端,用以支持,快速开发新的前端 相同前端不同内核,用以支持,新的开发语言 更多Python相关技术文章,请访问Python教程栏目进行学习! 以上就是python数据分析用什么编译器的详细内容,更多请关注码农之家其它相关文章! ……

    网友NO.839654

    Python实现的微信好友数据分析功能示例

    本文实例讲述了Python实现的微信好友数据分析功能。分享给大家供大家参考,具体如下: 这里主要利用python对个人微信好友进行分析并把结果输出到一个html文档当中,主要用到的python包为 itchat , pandas , pyecharts 等 1、安装itchat 微信的python sdk,用来获取个人好友关系。获取的代码 如下: import itchatimport pandas as pdfrom pyecharts import Geo, Baritchat.login()friends = itchat.get_friends(update=True)[0:]def User2dict(User): User_dict = {} User_dict["NickName"] = User["NickName"] if User["NickName"] else "NaN" User_dict["City"] = User["City"] if User["City"] else "NaN" User_dict["Sex"] = User["Sex"] if User["Sex"] else 0 User_dict["Signature"] = User["Signature"] if User["Signature"] else "NaN" User_dict["Province"] = User["Province"] if User["Province"] else "NaN" return User_dictfriends_list = [User2dict(i) for i in friends]data = pd.DataFrame(friends_list)data.to_csv('wechat_data.csv', index=True) 2、对获取到的数据进行分析。 主要分析了男女比例,以及好友所在城市分布,并且在地图上面展示了微信好友的分布情况。另外其他的数据读者可以自己去分析,这里只是提供一个引导而已。 import pandas as pdfrom pyecharts import Geo, Bardef Cal_mVw(data): result = {} for i in data: if i == 1: result["man"] = result.get("man", 0) + 1 elif i == 2: result["woman"] = result.get("woman", 0) + 1 else: result["unknown"] = resu……

    网友NO.684088

    python微信好友数据分析详解

    基于微信开放的个人号接口python库itchat,实现对微信好友的获取,并对省份、性别、微信签名做数据分析。 效果: 直接上代码,建三个空文本文件stopwords.txt,newdit.txt、unionWords.txt,下载字体simhei.ttf或删除字体要求的代码,就可以直接运行。 #wxfriends.py 2018-07-09import itchatimport sysimport pandas as pdimport matplotlib.pyplot as pltplt.rcParams['font.sans-serif']=['SimHei']#绘图时可以显示中文plt.rcParams['axes.unicode_minus']=False#绘图时可以显示中文import jiebaimport jieba.posseg as psegfrom scipy.misc import imreadfrom wordcloud import WordCloudfrom os import path#解决编码问题non_bmp_map = dict.fromkeys(range(0x10000, sys.maxunicode + 1), 0xfffd) #获取好友信息def getFriends(): friends = itchat.get_friends(update=True)[0:] flists = [] for i in friends: fdict={} fdict['NickName']=i['NickName'].translate(non_bmp_map) if i['Sex'] == 1: fdict['Sex']='男' elif i['Sex'] == 2: fdict['Sex']='女' else: fdict['Sex']='雌雄同体' if i['Province'] == '': fdict['Province'] ='未知' else: fdict['Province']=i['Province'] fdict['City']=i['City'] fdict['Signature']=i['Signature'] flists.append(fdict) return flists #将好友信息保存成CSVdef saveCSV(lists): df = pd.DataFrame(lists) try: df.to_csv("wxfriends.csv",index = True,encoding='gb18030') except Exception as ret: print(ret) return df #统计性别、省份字段 def anysys(df): df_sex = pd.DataFrame(df['Sex'].value_……

    网友NO.913812

    Python数据分析之双色球基于线性回归算法预测下期中奖结果示例

    本文实例讲述了Python数据分析之双色球基于线性回归算法预测下期中奖结果。分享给大家供大家参考,具体如下: 前面讲述了关于双色球的各种算法,这里将进行下期双色球号码的预测,想想有些小激动啊。 代码中使用了线性回归算法,这个场景使用这个算法,预测效果一般,各位可以考虑使用其他算法尝试结果。 发现之前有很多代码都是重复的工作,为了让代码看的更优雅,定义了函数,去调用,顿时高大上了 #!/usr/bin/python# -*- coding:UTF-8 -*-#导入需要的包import pandas as pdimport numpy as npimport matplotlib.pyplot as pltimport operatorfrom sklearn import datasets,linear_modelfrom sklearn.linear_model import LogisticRegression#读取文件df = pd.read_table('newdata.txt',header=None,sep=',')#读取日期tdate = sorted(df.loc[:,0])#将以列项为数据,将球号码取出,写入到csv文件中,并取50行数据# Function to red number to csv filedef RedToCsv(h_num,num,csv_name): h_num = df.loc[:,num:num].values h_num = h_num[50::-1] renum2 = pd.DataFrame(h_num) renum2.to_csv(csv_name,header=None) fp = file(csv_name) s = fp.read() fp.close() a = s.split('\n') a.insert(0, 'numid,number') s = '\n'.join(a) fp = file(csv_name, 'w') fp.write(s) fp.close()#调用取号码函数# create fileRedToCsv('red1',1,'rednum1data.csv')RedToCsv('red2',2,'rednum2data.csv')RedToCsv('red3',3,'rednum3data.csv')RedToCsv('red4',4,'rednum4data.cs……

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明