标签分类 热门分类
当前位置:首页 > 程序设计电子书 > 数据分析电子书网盘下载
对比Excel,轻松学习Python数据分析

对比Excel,轻松学习Python数据分析 完整原版电子书

官方价: 29.99

更 新:

对比Excel,轻松学习Python数据分析 (pdf、epub、mobi、azw3)下载

下载地址:https://pan.baidu.com/s/1vbpfhuNCVNkKCyKoCvevd

分享码:cx39

给大家带来的一篇关于数据分析相关的电子书资源,介绍了关于Excel、Python、数据分析方面的内容,本书是由电子工业出版社出版,格式根据源资源分为PDF、epub、mobi、azw3其中一种或多种格式,资源大小25.8 MB,张俊红编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.3,更多相关的学习资源可以参阅 程序设计电子书数据库电子书、等栏目。

对比Excel,轻松学习Python数据分析 PDF

Python尽管是这门计算机语言,可是在数据分析行业保持的作用和Excel的基本要素相同,而Excel也是大伙儿较为了解、非常容易入门的手机软件,能够根据Excel数据分析去比照学习培训Python数据分析。这书将数据分析全过程中涉及到的每1个实际操作都对比解读,给你从了解的Excel实际操作中来学习培训相匹配的Python保持,而并不是立即学习培训Python编码,大幅度降低了学习培训门坎,清除了大伙儿对编码的心理恐惧。这都是这书的一整特点,让用户能够像学Excel数据分析相同,轻轻松松学习培训Python数据分析。

集Python、Excel、数据分析为一体化是这书的一整特点。这书紧紧围绕全部数据分析的基本步骤:小工具了解-读取数据-统计数据了解-数据处理方法-数据分析-剖析結果开展Excel 和Python 比照保持,对你说每1个全过程中都是采用哪些?全过程与全过程中间有哪些联络。那样一本好书既能够做为系统软件学习培训数据分析步骤实际操作的使用说明,还可以做为1本数据分析师案头必需的实操工具书,随时随地备查簿。这书根据比照Excel 作用实际操作去学习培训Python 的保持编码,而并不是立即上去就学习培训Python编码,大幅度降低了学习培训门坎,清除了用户对编码的心理恐惧。合适刚入门的数据分析师,也合适对Excel 较为娴熟的数据分析师,或从业别的职位想提高效率的初入职场人。

目录

  • 入门篇
  • 第1 章 数据分析基础 . 2
  • 1.1 数据分析是什么 2
  • 1.2 为什么要做数据分析 2
  • 1.2.1 现状分析 . 3
  • 1.2.2 原因分析 . 3
  • 1.2.3 预测分析 . 3
  • 1.3 数据分析究竟在分析什么 4
  • 1.3.1 总体概览指标 . 4
  • 1.3.2 对比性指标 . 4
  • 1.3.3 集中趋势指标 . 4
  • 1.3.4 离散程度指标 . 5
  • 1.3.5 相关性指标 . 5
  • 1.3.6 相关关系与因果关系 . 6
  • 1.4 数据分析的常规流程 6
  • 1.4.1 熟悉工具 . 6
  • 1.4.2 明确目的 . 7
  • 1.4.3 获取数据 . 7
  • 1.4.4 熟悉数据 . 7
  • 1.4.5 处理数据 . 7
  • 1.4.6 分析数据 . 8
  • 1.4.7 得出结论 . 8
  • 1.4.8 验证结论 . 8
  • 1.4.9 展示结论 . 8
  • 1.5 数据分析工具:Excel 与Python .. 8
  • 实践篇
  • 第2 章 熟悉锅——Python 基础知识 . 12
  • 2.1 Python 是什么 .. 12
  • 2.2 Python 的下载与安装 .. 13
  • 2.2.1 安装教程 ... 13
  • 2.2.2 IDE 与IDLE . 17
  • 2.3 介绍Jupyter Notebook 17
  • 2.3.1 新建Jupyter Notebook 文件 17
  • 2.3.2 运行你的第一段代码 ... 19
  • 2.3.3 重命名Jupyter Notebook 文件 19
  • 2.3.4 保存Jupyter Notebook 文件 19
  • 2.3.5 导入本地Jupyter Notebook 文件 20
  • 2.3.6 Jupyter Notebook 与Markdown ... 21
  • 2.3.7 为Jupyter Notebook 添加目录 21
  • 2.4 基本概念 .. 26
  • 2.4.1 数 ... 26
  • 2.4.2 变量 ... 26
  • 2.4.3 标识符 ... 27
  • 2.4.4 数据类型 ... 28
  • 2.4.5 输出与输出格式设置 ... 28
  • 2.4.6 缩进与注释 ... 29
  • 2.5 字符串 .. 30
  • 2.5.1 字符串的概念 ... 30
  • 2.5.2 字符串的连接 ... 30
  • 2.5.3 字符串的复制 ... 30
  • 2.5.4 获取字符串的长度 ... 30
  • 2.5.5 字符串查找 ... 31
  • 2.5.6 字符串索引 ... 31
  • 2.5.7 字符串分隔 ... 32
  • 2.5.8 移除字符 ... 32
  • 2.6 数据结构——列表 .. 33
  • 2.6.1 列表的概念 ... 33
  • 2.6.2 新建一个列表 ... 33
  • 2.6.3 列表的复制 ... 34
  • 2.6.4 列表的合并 ... 34
  • 2.6.5 向列表中插入新元素 ... 34
  • 2.6.6 获取列表中值出现的次数 ... 35
  • 2.6.7 获取列表中值出现的位置 ... 35
  • 2.6.8 获取列表中指定位置的值 ... 36
  • 2.6.9 删除列表中的值 ... 36
  • 2.6.10 对列表中的值进行排序 . 37
  • 2.7 数据结构——字典 .. 37
  • 2.7.1 字典的概念 ... 37
  • 2.7.3 字典的keys()、values()和items()方法 ... 37
  • 2.8 数据结构——元组 .. 38
  • 2.8.1 元组的概念 ... 38
  • 2.8.2 新建一个元组 ... 38
  • 2.8.3 获取元组的长度 ... 38
  • 2.8.4 获取元组内的元素 ... 39
  • 2.8.5 元组与列表相互转换 ... 39
  • 2.8.6 zip()函数 ... 39
  • 2.9 运算符 .. 40
  • 2.9.1 算术运算符 ... 40
  • 2.9.2 比较运算符 ... 40
  • 2.9.3 逻辑运算符 ... 41
  • 2.10 循环语句 41
  • 2.10.1 for 循环 ... 41
  • 2.10.2 while 循环 ... 42
  • 2.11 条件语句 43
  • 2.11.1 if 语句 . 43
  • 2.11.2 else 语句 .. 44
  • 2.11.3 elif 语句 .. 45
  • 2.12 函数 46
  • 2.12.1 普通函数 . 47
  • 2.12.2 匿名函数 . 48
  • 2.13 高级特性 49
  • 2.13.1 列表生成式 . 49
  • 2.13.2 map 函数 . 50
  • 2.14 模块 50
  • 第3 章 Pandas 数据结构 . 51
  • 3.1 Series 数据结构 ... 51
  • 3.1.1 Series 是什么 51
  • 3.1.2 创建一个Series 52
  • 3.1.3 利用index 方法获取Series 的索引 53
  • 3.1.4 利用values 方法获取Series 的值 ... 53
  • 3.2 DataFrame 表格型数据结构 ... 53
  • 3.2.1 DataFrame 是什么 53
  • 3.2.2 创建一个DataFrame 54
  • 3.2.3 获取DataFrame 的行、列索引 ... 56
  • 3.2.4 获取DataFrame 的值 ... 56
  • 第4 章 准备食材——获取数据源 .. 57
  • 4.1 导入外部数据 .. 57
  • 4.1.1 导入.xlsx 文件 .. 57
  • 4.1.2 导入.csv 文件 ... 60
  • 4.1.3 导入.txt 文件 63
  • 4.1.4 导入sql 文件 65
  • 4.2 新建数据 .. 67
  • 4.3 熟悉数据 .. 67
  • 4.3.1 利用head 预览前几行 . 67
  • 4.3.2 利用shape 获取数据表的大小 68
  • 4.3.3 利用info 获取数据类型 .. 69
  • 4.3.4 利用describe 获取数值分布情况 71
  • 第5 章 淘米洗菜——数据预处理 .. 73
  • 5.1 缺失值处理 .. 73
  • 5.1.1 缺失值查看 ... 73
  • 5.1.2 缺失值删除 ... 75
  • 5.1.3 缺失值填充 ... 77
  • 5.2 重复值处理 .. 78
  • 5.3 异常值的检测与处理 .. 81
  • 5.3.1 异常值检测 ... 81
  • 5.3.2 异常值处理 ... 82
  • 5.4 数据类型转换 .. 83
  • 5.4.1 数据类型 ... 83
  • 5.4.2 类型转换 ... 84
  • 5.5 索引设置 .. 86
  • 5.5.1 为无索引表添加索引 ... 86
  • 5.5.2 重新设置索引 ... 87
  • 5.5.3 重命名索引 ... 88
  • 5.5.4 重置索引 ... 89
  • 第6 章 菜品挑选——数据选择 . 91
  • 6.1 列选择 .. 91
  • 6.1.1 选择某一列/某几列 .. 91
  • 6.1.2 选择连续的某几列 ... 92
  • 6.2 行选择 .. 93
  • 6.2.1 选择某一行/某几行 .. 93
  • 6.2.2 选择连续的某几行 ... 94
  • 6.2.3 选择满足条件的行 ... 95
  • 6.3 行列同时选择 .. 96
  • 6.3.1 普通索引 普通索引选择指定的行和列 . 97
  • 6.3.2 位置索引 位置索引选择指定的行和列 . 97
  • 6.3.3 布尔索引 普通索引选择指定的行和列 . 98
  • 6.3.4 切片索引 切片索引选择指定的行和列 . 98
  • 6.3.5 切片索引 普通索引选择指定的行和列 . 99
  • 第7 章 切配菜品——数值操作 ... 100
  • 7.1 数值替换 100
  • 7.1.1 一对一替换 . 100
  • 7.1.2 多对一替换 . 102
  • 7.1.3 多对多替换 . 103
  • 7.2 数值排序 104
  • 7.2.1 按照一列数值进行排序 . 104
  • 7.2.2 按照有缺失值的列进行排序 . 106
  • 7.2.3 按照多列数值进行排序 . 106
  • 7.3 数值排名 108
  • 7.4 数值删除 . 110
  • 7.4.1 删除列 .. 110
  • 7.4.2 删除行 .. 111
  • 7.4.3 删除特定行 .. 112
  • 7.5 数值计数 . 113
  • 7.6 唯一值获取 . 114
  • 7.7 数值查找 . 115
  • 7.8 区间切分 . 116
  • 7.9 插入新的行或列 . 119
  • 7.10 行列互换 .. 120
  • 7.11 索引重塑 .. 121
  • 7.12 长宽表转换 .. 122
  • 7.12.1 宽表转换为长表 ... 123
  • 7.12.2 长表转换为宽表 ... 125
  • 7.13 apply()与applymap()函数 ... 126
  • 第8 章 开始烹调——数据运算 ... 127
  • 8.1 算术运算 127
  • 8.2 比较运算 128
  • 8.3 汇总运算 129
  • 8.3.1 count 非空值计数 ... 129
  • 8.3.2 sum 求和 . 130
  • 8.3.3 mean 求均值 ... 130
  • 8.3.4 max 求最大值 . 131
  • 8.3.5 min 求最小值 . 132
  • 8.3.6 median 求中位数 132
  • 8.3.7 mode 求众数 ... 133
  • 8.3.8 var 求方差 ... 134
  • 8.3.9 std 求标准差 ... 134
  • 8.3.10 quantile 求分位数 . 135
  • 8.4 相关性运算 136
  • 第9 章 炒菜计时器——时间序列 138
  • 9.1 获取当前时刻的时间 138
  • 9.1.1 返回当前时刻的日期和时间 . 138
  • 9.1.2 分别返回当前时刻的年、月、日 . 138
  • 9.1.3 返回当前时刻的周数 . 139
  • 9.2 指定日期和时间的格式 140
  • 9.3 字符串和时间格式相互转换 141
  • 9.3.1 将时间格式转换为字符串格式 . 141
  • 9.3.2 将字符串格式转换为时间格式 . 141
  • 9.4 时间索引 142
  • 9.5 时间运算 145
  • 9.5.1 两个时间之差 . 145
  • 9.5.2 时间偏移 . 145
  • 第10 章 菜品分类——数据分组/数据透视表 .. 148
  • 10.1 数据分组 .. 148
  • 10.1.1 分组键是列名 ... 150
  • 10.1.2 分组键是Series 151
  • 10.1.3 神奇的aggregate 方法 . 152
  • 10.1.4 对分组后的结果重置索引 ... 153
  • 10.2 数据透视表 .. 154
  • 第11 章 水果拼盘——多表拼接 . 158
  • 11.1 表的横向拼接 .. 158
  • 11.1.1 连接表的类型 ... 158
  • 11.1.2 连接键的类型 ... 160
  • 11.1.3 连接方式 ... 163
  • 11.1.4 重复列名处理 ... 165
  • 11.2 表的纵向拼接 .. 165
  • 11.2.1 普通合并 ... 166
  • 11.2.2 索引设置 ... 167
  • 11.2.3 重叠数据合并 ... 167
  • 第12 章 盛菜装盘——结果导出 . 169
  • 12.1 导出为.xlsx 文件 . 169
  • 12.1.1 设置文件导出路径 ... 170
  • 12.1.2 设置Sheet 名称 170
  • 12.1.3 设置索引 ... 170
  • 12.1.4 设置要导出的列 ... 171
  • 12.1.5 设置编码格式 ... 171
  • 12.1.6 缺失值处理 ... 172
  • 12.1.7 无穷值处理 ... 172
  • 12.2 导出为.csv 文件 ... 173
  • 12.2.1 设置文件导出路径 ... 173
  • 12.2.2 设置索引 ... 174
  • 12.2.3 设置要导出的列 ... 174
  • 12.2.4 设置分隔符号 ... 174
  • 12.2.5 缺失值处理 ... 174
  • 12.2.6 设置编码格式 ... 175
  • 12.3 将文件导出到多个Sheet 175
  • 第13 章 菜品摆放——数据可视化 .. 176
  • 13.1 数据可视化是什么 .. 176
  • 13.2 数据可视化的基本流程 .. 176
  • 13.2.1 整理数据 ... 176
  • 13.2.2 明确目的 ... 177
  • 13.2.3 寻找合适的表现形式 ... 177
  • 13.3 图表的基本组成元素 .. 177
  • 13.4 Excel 与Python 可视化 ... 179
  • 13.5 建立画布和坐标系 .. 179
  • 13.5.1 建立画布 ... 179
  • 13.5.2 用add_subplot 函数建立坐标系 . 180
  • 13.5.3 用plt.subplot2grid 函数建立坐标系 182
  • 13.5.4 用plt.subplot 函数建立坐标系 183
  • 13.5.5 用plt.subplots 函数建立坐标系 .. 184
  • 13.5.6 几种创建坐标系方法的区别 ... 185
  • 13.6 设置坐标轴 .. 185
  • 13.6.1 设置坐标轴的标题 ... 185
  • 13.6.2 设置坐标轴的刻度 ... 187
  • 13.6.3 设置坐标轴的范围 ... 190
  • 13.6.4 坐标轴的轴显示设置 ... 191
  • 13.7 其他图表格式的设置 .. 191
  • 13.7.1 网格线设置 ... 191
  • 13.7.2 设置图例 ... 193
  • 13.7.3 图表标题设置 ... 195
  • 13.7.4 设置数据标签 ... 197
  • 13.7.5 图表注释 ... 198
  • 13.7.6 数据表 ... 199
  • 13.8 绘制常用图表 .. 201
  • 13.8.1 绘制折线图 ...

上一篇:如何用数据解决实际问题  下一篇:Python网络爬虫权威指南

展开 +

收起 -

数据分析 相关电子书
数据分析 学习笔记
网友NO.687356

python可以用来做excel吗

大家好,我们今天来一起探索一下用Python怎么操作Excel文件。与word文件的操作库python-docx类似,Python也有专门的库为Excel文件的操作提供支持,这些库包括xlrd、xlwt、xlutils、openpyxl、xlsxwriter几种,其中我最喜欢用的是openpyxl,这也是本次讲解的主要内容。Excel文件大家也不陌生了,平时办公、学习中都会用到,大家回忆一下,你操作一个Excel文件是什么步骤呢?下图给出一个Excel文件,大家对照着想一想。 OK,我们一起捋一捋,首先要新建或打开一个 Excel文件 ,然后选择某个 工作表 ,也就是上图中的sheet,最后读取或设置 单元格 的值。与此相对应的,在openpyxl中,有三个概念:Workbooks,Sheets,Cells。Workbook就是一个打开的excel文件,即excel工作簿;Sheet是工作簿中的一张表,即工作表;Cell就是一个简单的单元格。openpyxl就是围绕着这三个概念进行的,不管读写都是“三板斧”:打开Workbook,定位Sheet,操作Cell。OK,了解了基本概念,我们实际操作看看吧! 首先,openpyxl并不是Python 3预装的库,需要我们手动安装,很简单打开命令行窗口输入pip install openpyxl就可以了。如下图所示,我的已经安装好了,所以输出信息可能和大家的会不一样。 安装好openpyxl后,通过import语句导入,再通过执行help方法,看看openpyxl库中包含哪些东西,不……

网友NO.471585

Python关于excel和shp的使用在matplotlib

关于excel和shp的使用在matplotlib 使用pandas 对excel进行简单操作 使用cartopy 读取shpfile 展示到matplotlib中 利用shpfile文件中的一些字段进行一些着色处理 #!/usr/bin/env python# -*- coding: utf-8 -*-# @File : map02.py# @Author: huifer# @Date : 2018/6/28import foliumimport pandas as pdimport requestsimport matplotlib.pyplot as pltimport cartopy.crs as ccrsimport zipfileimport cartopy.io.shapereader as shapereadfrom matplotlib import cmfrom cartopy.mpl.ticker import LongitudeFormatter, LatitudeFormatterimport osdataurl = "http://image.data.cma.cn/static/doc/A/A.0012.0001/SURF_CHN_MUL_HOR_STATION.xlsx"shpurl = "http://www.naturalearthdata.com/http//www.naturalearthdata.com/download/10m/cultural/ne_10m_admin_0_countries.zip"def download_file(url): """ 根据url下载文件 :param url: str """ r = requests.get(url, allow_redirects=True) try: open(url.split('/')[-1], 'wb').write(r.content) except Exception as e: print(e)def degree_conversion_decimal(x): """ 度分转换成十进制 :param x: float :return: integer float """ integer = int(x) integer = integer + (x - integer) * 1.66666667 return integerdef unzip(zip_path, out_path): """ 解压zip :param zip_path:str :param out_path: str :return: """ zip_ref = zipfile.ZipFile(zip_path, 'r') zip_ref.extractall(out_path) zip_ref.close()def get_record(shp, key, value): countries = shp.records() result = [country for country in countries if country.attributes[key] == value] countries = shp.records() r……

网友NO.778158

解决Python pandas df 写入excel 出现的问题

学习Python数据分析挖掘实战一书时,在数据预处理阶段,有一节要使用拉格朗日插值法对缺失值补充,代码如下: #-*- coding:utf-8 -*-import pandas as pdimport matplotlib.pyplot as pltfrom scipy.interpolate import lagrange#导入拉格朗日插值函数inputfile="catering_sale.xls"outputfile="H:\python\file\python_data_annalysis_mining\chapter04\sales.xls"data=pd.read_excel(inputfile,sheetname=0)statistic=data.describe()#保存基本统计量print statistictime=data[u'日期'].valuesnumber=data[u'销量'].valuesplt.scatter(time,number)plt.show()#根据散点图找过滤异常值的方法data[u'销量'][(data[u'销量']300)|(data[u'销量']6000)]=None#过滤异常值,设置为空#自定义列向量插值函数#s为列向量,n为插值位置,k为取前后的数据个数,默认为5,不宜太多,受到数值不稳定性影响def ployinterp_column(s,n,k=5): y=s[list(range(n-k,n))+list(range(n+1,n+1+k))] y=y[y.notnull()]#剔除异常值 return lagrange(y.index,list(y))(n)#插值并返回插值结果for i in data.columns: for j in range(len(data)): if(data[i].isnull())[j]: data[i][j]=ployinterp_column(data[i],j)data.to_excel(outputfile) 1.import xlwt 错误 这个问题比较简单,只需要在官网上下载安装或者直接在编译器中运行如下代码即可, pip install xlwt 2.to_excel错误 这个错误是由于下面这句代码引起的, data.to_excel(outputfile) 错误描述:无效的模式('w+b')或者文件名……

网友NO.398251

python 读写excel文件操作示例【附源码下载】

本文实例讲述了python 读写excel文件操作。分享给大家供大家参考,具体如下: 对excel文件的操作,python有第三方的工具包支持,xlutils,在这个工具包中包含了xlrd,xlwt等工具包.利用这些工具,可以方便的对excel 进行操作。 1. 下载 xlutils : http://pypi.python.org/pypi/xlutils 2. 安装,解压下载文件之后,可以 python setup.py install 3. 应用(生成EXCEL,遍历EXCEL,修改EXCEL,属性控制,日期控制等)。 1) 创建 EXCEL 文件 from tempfile import TemporaryFilefrom xlwt import Workbookbook = Workbook()sheet1 = book.add_sheet('Sheet 1')book.add_sheet('Sheet 2')sheet1.write(0,0,'A1')sheet1.write(0,1,'B1')row1 = sheet1.row(1)row1.write(0,'A2')row1.write(1,'B2')sheet1.col(0).width = 10000sheet2 = book.get_sheet(1)sheet2.row(0).write(0,'Sheet 2 A1')sheet2.row(0).write(1,'Sheet 2 B1')sheet2.flush_row_data()sheet2.write(1,0,'Sheet 2 A3')sheet2.col(0).width = 5000sheet2.col(0).hidden = Truebook.save('simple.xls')book.save(TemporaryFile()) 这样就生成了simple.xls 文件. 2) 循环遍历EXCEL文件 import xlrdimport xlutils.copyimport osif __name__ == '__main__': wb = xlrd.open_workbook('simple.xls') for s in wb.sheets(): print 'Sheet:',s.name for row in range(s.nrows): values = [] for col in range(s.ncols): values.append(s.cell(row,col).value) print ','.join(values) print 遍历整个excel 并打印出数据 3) 修改EXCEL import xlrdimport xlutils.copyimport osif __name__ == '__main__': templat……

码小辫

码小辫 发起

资源
17
粉丝
49
喜欢
479
评论
13

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明