标签分类
当前位置:首页 > 程序设计电子书 > Python电子书网盘下载
Python数据分析与挖掘实战 Python数据分析与挖掘实战
43230437

43230437 提供上传

资源
43
粉丝
13
喜欢
284
评论
14

    Python数据分析与挖掘实战 PDF 高质量版

    Python电子书
    • 发布时间:

    给大家带来的一篇关于Python相关的电子书资源,介绍了关于Python、数据分析、挖掘实战方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小46.8 MB,张良均编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.6,更多相关的学习资源可以参阅 程序设计电子书Python电子书、等栏目。

  • Python数据分析与挖掘实战 PDF 下载
  • 下载地址:https://pan.baidu.com/s/1DcXlaVd0jZo3wgHua8hRnQ
  • 分享码:tdd7
  • Python数据分析与挖掘实战 PDF

    10余名大数据挖掘行业杰出权威专家和科技人员,10多年大数据分析资询与执行工作经验结晶体。从大数据挖掘的运用来看,以电力工程、航空公司、诊疗、互联网技术、生产加工及其公共文化服务等制造行业真正实例主导线,从入门到精通详细介绍Python大数据挖掘模型全过程,理论性极强。

    这书共15章,分2个一部分:基本篇、实战篇。基本篇详细介绍了大数据挖掘的基本概念,实战篇详细介绍了一个一个真正实例,根据对实例从入门到精通的分析,使用户在不经意间中根据实例实践活动得到数据挖掘项目工作经验,另外迅速理解看起来晦涩难懂的大数据挖掘基础理论。用户在阅读文章全过程中,应灵活运用随书配套设施的实例模型统计数据,依靠有关的大数据挖掘建模工具,根据上机操作试验,以迅速了解有关专业知识与基础理论。

    基本篇(第1~5章),第1章的主题思想是大数据挖掘简述;第2章对这书常用到的大数据挖掘建模工具Python語言开展了言简意赅的表明;第3章、第4章、第5章对大数据挖掘的模型全过程,包含统计数据探寻、数据预处理及发掘模型的常见优化算法与基本原理开展了详细介绍。
    实战篇(第6~15章),重中之重对数据挖掘算法在电力工程、航空公司、诊疗、互联网技术、生产加工及其公共文化服务等制造行业的运用开展了剖析。在实例构造机构上,这书是依照先详细介绍实例背景图与发掘总体目标,再论述统计分析方法与全过程,*后进行实体模型搭建的次序开展的,在模型全过程的重要环节,交叉程序实现编码。*后根据上机操作实践活动,加重用户对数据挖掘算法在实例运用中的了解。

    目录

    • 前 言
    • 基 础 篇
    • 第1章 数据挖掘基础2
    • 1.1 某知名连锁餐饮企业的困惑2
    • 1.2 从餐饮服务到数据挖掘3
    • 1.3 数据挖掘的基本任务4
    • 1.4 数据挖掘建模过程4
    • 1.4.1 定义挖掘目标4
    • 1.4.2 数据取样5
    • 1.4.3 数据探索6
    • 1.4.4 数据预处理7
    • 1.4.5 挖掘建模7
    • 1.4.6 模型评价7
    • 1.5 常用的数据挖掘建模工具7
    • 1.6 小结9
    • 第2章 Python数据分析简介10
    • 2.1 搭建Python开发平台12
    • 2.1.1 所要考虑的问题12
    • 2.1.2 基础平台的搭建12
    • 2.2 Python使用入门13
    • 2.2.1 运行方式14
    • 2.2.2 基本命令15
    • 2.2.3 数据结构17
    • 2.2.4 库的导入与添加20
    • 2.3 Python数据分析工具22
    • 2.3.1 Numpy23
    • 2.3.2 Scipy24
    • 2.3.3 Matplotlib24
    • 2.3.4 Pandas26
    • 2.3.5 StatsModels27
    • 2.3.6 Scikit-Learn28
    • 2.3.7 Keras29
    • 2.3.8 Gensim30
    • 2.4 配套资源使用设置31
    • 2.5 小结32
    • 第3章 数据探索33
    • 3.1 数据质量分析33
    • 3.1.1 缺失值分析34
    • 3.1.2 异常值分析34
    • 3.1.3 一致性分析37
    • 3.2 数据特征分析37
    • 3.2.1 分布分析37
    • 3.2.2 对比分析40
    • 3.2.3 统计量分析41
    • 3.2.4 周期性分析44
    • 3.2.5 贡献度分析45
    • 3.2.6 相关性分析47
    • 3.3 Python主要数据探索函数50
    • 3.3.1 基本统计特征函数50
    • 3.3.2 拓展统计特征函数53
    • 3.3.3 统计作图函数54
    • 3.4 小结59
    • 第4章 数据预处理60
    • 4.1 数据清洗60
    • 4.1.1 缺失值处理60
    • 4.1.2 异常值处理64
    • 4.2 数据集成64
    • 4.2.1 实体识别64
    • 4.2.2 冗余属性识别65
    • 4.3 数据变换65
    • 4.3.1 简单函数变换65
    • 4.3.2 规范化66
    • 4.3.3 连续属性离散化68
    • 4.3.4 属性构造70
    • 4.3.5 小波变换71
    • 4.4 数据规约74
    • 4.4.1 属性规约74
    • 4.4.2 数值规约77
    • 4.5 Python主要数据预处理函数80
    • 4.6 小结81
    • 第5章 挖掘建模83
    • 5.1 分类与预测83
    • 5.1.1 实现过程83
    • 5.1.2 常用的分类与预测算法84
    • 5.1.3 回归分析85
    • 5.1.4 决策树89
    • 5.1.5 人工神经网络95
    • 5.1.6 分类与预测算法评价100
    • 5.1.7 Python分类预测模型特点103
    • 5.2 聚类分析104
    • 5.2.1 常用聚类分析算法104
    • 5.2.2 K-Means聚类算法105
    • 5.2.3 聚类分析算法评价111
    • 5.2.4 Python主要聚类分析算法111
    • 5.3 关联规则113
    • 5.3.1 常用关联规则算法114
    • 5.3.2 Apriori算法114
    • 5.4 时序模式119
    • 5.4.1 时间序列算法120
    • 5.4.2 时间序列的预处理120
    • 5.4.3 平稳时间序列分析122
    • 5.4.4 非平稳时间序列分析124
    • 5.4.5 Python主要时序模式算法132
    • 5.5 离群点检测134
    • 5.5.1 离群点检测方法135
    • 5.5.2 基于模型的离群点检测方法136
    • 5.5.3 基于聚类的离群点检测方法138
    • 5.6 小结141
    • 实 战 篇
    • 第6章 电力窃漏电用户自动识别144
    • 6.1 背景与挖掘目标144
    • 6.2 分析方法与过程147
    • 6.2.1 数据抽取148
    • 6.2.2 数据探索分析148
    • 6.2.3 数据预处理151
    • 6.2.4 构建专家样本156
    • 6.2.5 模型构建157
    • 6.3 上机实验161
    • 6.4 拓展思考162
    • 6.5 小结163
    • 第7章 航空公司客户价值分析164
    • 7.1 背景与挖掘目标164
    • 7.2 分析方法与过程166
    • 7.2.1 数据抽取168
    • 7.2.2 数据探索分析168
    • 7.2.3 数据预处理169
    • 7.2.4 模型构建173
    • 7.3 上机实验177
    • 7.4 拓展思考178
    • 7.5 小结179
    • 第8章 中医证型关联规则挖掘180
    • 8.1 背景与挖掘目标180
    • 8.2 分析方法与过程181
    • 8.2.1 数据获取183
    • 8.2.2 数据预处理186
    • 8.2.3 模型构建190
    • 8.3 上机实验193
    • 8.4 拓展思考194
    • 8.5 小结194
    • 第9章 基于水色图像的水质评价195
    • 9.1 背景与挖掘目标195
    • 9.2 分析方法与过程195
    • 9.2.1 数据预处理197
    • 9.2.2 模型构建199
    • 9.2.3 水质评价201
    • 9.3 上机实验202
    • 9.4 拓展思考202
    • 9.5 小结203
    • 第10章 家用电器用户行为分析与事件识别204
    • 10.1 背景与挖掘目标204
    • 10.2 分析方法与过程205
    • 10.2.1 数据抽取206
    • 10.2.2 数据探索分析207
    • 10.2.3 数据预处理207
    • 10.2.4 模型构建217
    • 10.2.5 模型检验219
    • 10.3 上机实验220
    • 10.4 拓展思考221
    • 10.5 小结222
    • 第11章 应用系统负载分析与磁盘容量预测223
    • 11.1 背景与挖掘目标223
    • 11.2 分析方法与过程225
    • 11.2.1 数据抽取226
    • 11.2.2 数据探索分析226
    • 11.2.3 数据预处理227
    • 11.2.4 模型构建229
    • 11.3 上机实验235
    • 11.4 拓展思考236
    • 11.5 小结237
    • 第12章 电子商务网站用户行为分析及服务推荐238
    • 12.1 背景与挖掘目标238
    • 12.2 分析方法与过程240
    • 12.2.1 数据抽取242
    • 12.2.2 数据探索分析244
    • 12.2.3 数据预处理251
    • 12.2.4 模型构建256
    • 12.3 上机实验266
    • 12.4 拓展思考267
    • 12.5 小结269
    • 第13章 财政收入影响因素分析及预测模型270
    • 13.1 背景与挖掘目标270
    • 13.2 分析方法与过程272
    • 13.2.1 灰色预测与神经网络的组合模型273
    • 13.2.2 数据探索分析274
    • 13.2.3 模型构建277
    • 13.3 上机实验294
    • 13.4 拓展思考295
    • 13.5 小结296
    • 第14章 基于基站定位数据的商圈分析297
    • 14.1 背景与挖掘目标297
    • 14.2 分析方法与过程299
    • 14.2.1 数据抽取299
    • 14.2.2 数据探索分析299
    • 14.2.3 数据预处理301
    • 14.2.4 模型构建304
    • 14.3 上机实验308
    • 14.4 拓展思考309
    • 14.5 小结309
    • 第15章 电商产品评论数据情感分析310
    • 15.1 背景与挖掘目标310
    • 15.2 分析方法与过程310
    • 15.2.1 评论数据采集311
    • 15.2.2 评论预处理314
    • 15.2.3 文本评论分词320
    • 15.2.4 模型构建320
    • 15.3 上机实验333
    • 15.4 拓展思考334
    • 15.5 小结335
    • 参考文献336

    上一篇:计算机科学概论  下一篇:JavaScript高级程序设计

    展开 +

    收起 -

    码小辫二维码
     

    Python相关电子书
    学习笔记
    网友NO.560958

    Python数据可视化利器Matplotlib详解

    下面小编就为大家带来一篇基于Python数据可视化利器Matplotlib,绘图入门篇,Pyplot详解。小编觉得挺不错的,现在就分享给大家,也给大家做个参考。一起跟随小编过来看看吧 Pyplot matplotlib.pyplot是一个命令型函数集合,它可以让我们像使用MATLAB一样使用matplotlib。pyplot中的每一个函数都会对画布图像作出相应的改变,如创建画布、在画布中创建一个绘图区、在绘图区上画几条线、给图像添加文字说明等。下面我们就通过实例代码来领略一下他的魅力。 import matplotlib.pyplot as pltplt.plot([1,2,3,4])plt.ylabel('some numbers')plt.show() 上图是我们通过plt.plot([1,2,3,4])这一行代码画出的图像,这时候有的小伙伴可能会有一个疑问,“为什么X轴的坐标轴范围是0-3,而Y轴的坐标轴围是1-4呢?” 这是因为,在我们使用plot()命令函数的时候,如果只给函数传递了一个数值列表或数组作为参数,matplotlib会把这个数值列表当作Y轴的数值,然后根据Y轴的数值个数N自动生成一个数值列表[0,N-1]作为X轴的数值。所以上图中Y轴数值就是我们给定的列表[1,2,3,4],X轴数值是自动生成的列表[0,1,2,3]。 看到这里有的小伙伴可能会想,这也太弱了吧。大家不要着急,我们一步步的来学习,上图只是一个非常简单例子,其实plot() 命令的功能非常强大,通过该命令我们可以同时传……

    网友NO.613171

    使用python将mysql数据库的数据转换为json数据的方法

    由于产品运营部需要采用第三方个推平台,来推送消息。如果手动一个个键入字段和字段值,容易出错,且非常繁琐,需要将mysql的数据转换为json数据,直接复制即可。 本文将涉及到如何使用Python访问Mysql数据库及读取获取数据(前提需要安装MySQLdb第三方库哦),以及如何将数据转换为json数据,最后保存成文件输出。 代码如下:注释比较详细了。 # coding=utf-8'''Created on 2016-10-26@author: JenniferProject:读取mysql数据库的数据,转为json格式'''import json,MySQLdbdef TableToJson(): try: #1-7:如何使用python DB API访问数据库流程的 #1.创建mysql数据库连接对象connection #connection对象支持的方法有cursor(),commit(),rollback(),close() conn = MySQLdb.Connect(host='mysql服务器地址',user='用户名',passwd='密码',db='数据库名称',port=3306,charset = 'utf8') #2.创建mysql数据库游标对象 cursor #cursor对象支持的方法有execute(sql语句),fetchone(),fetchmany(size),fetchall(),rowcount,close() cur = conn.cursor() #3.编写sql sql = "SELECT pm.name AS nm,pm.desc AS dc,pm.image_url AS iu,pm.image_type AS it, pm.on_going AS og, pm.type AS mt,pm.pkgName AS pn,pm.apk_url AS du,pm.apkMd5 AS am,pm.minversionCode AS mc,pm.versionCode AS vc,pm.versionName AS vn, pm.signatureMd5 AS sm,pm.source AS se,pm.action AS ao FROM message pm WHERE pm.id = '217'" #4.执行sql命令 #execute可执行数据库查询select和命令in……

    网友NO.397235

    python提取包含关键字的整行数据方法

    问题描述: 如下图所示,有一个近2000行的数据表,需要把其中含有关键字‘颈廓清术,中央组(VI组)'的数据所在行都都给抽取出来,且提取后的表格不能改变原先的顺序。 问题分析: 一开始想用excel的筛选功能,但是发现只提供单列筛选,由于关键词在P,S,V,Y,AB列都有,故需要筛选5次。但是筛选完后再整合再一起的表格顺序就乱了,而原先的表格排序规律不可知,无法通过简单的排序实现。于是决定用Python写个代码来解决这个问题~ python生成的表格是这个样子滴^_^那些空白的行就是不符合要求的,我们还需要把这些空白的行给删掉~ 方法很简单,使用excel的定位条件-空值-将所选行删除掉: 以上这篇python提取包含关键字的整行数据方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家。 ……

    网友NO.940893

    Python操作SQL Server数据库的方法

    0.目录 1.前言 2.准备工作 3.简单测试语句 4.提交与回滚 5.封装成类的写法 1.前言 前面学完了SQL Server的基本语法,接下来学习如何在程序中使用sql,毕竟不能在程序中使用的话,实用性就不那么大了。 2.最基本的SQL查询语句 python是使用pymssql这个模块来操作SQL Server数据库的,所有需要先安装pymssql。 这个直接在命令行里输入 pip install pymssql 安装就行了 然后还要配置好自己本地的SQL Server数据库,进入Microsoft SQL Server Management Studio中可以进行设置。如果你选择的是使用Windows身份验证的方式的话,要改成SQL验证方式才行。这个网上教程很多,搜索一下就出来了。 3.简单测试语句 打开IDLE,新建python程序: import pymssqlconn = pymssql.connect(host='127.0.0.1', user='sa', password='123', database='SQLTest', charset='utf8')#查看连接是否成功cursor = conn.cursor()sql = 'select * from student'cursor.execute(sql)#用一个rs变量获取数据rs = cursor.fetchall()print(rs) 4.提交与回滚 在python中,在操作完 增删改 之后,还需要执行commit()才能真正提交代码执行,如果出意外的话就执行rollback()回滚到之前的状态,相当于之前的操作都白做了,这样也保护了数据库。 所以建议写程序这样写: try: conn = pymssql.connect(host='127.0.0.1', user='sa', password='123', database='SQLTest', charset='utf8') cursor = conn.cursor() sql = '……

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明