标签分类 热门分类
当前位置:首页 > 程序设计电子书 > Python数据电子书网盘下载
Python数据分析与数据化运营

Python数据分析与数据化运营 第2版电子书

官方价: 64.99

更 新:

Python数据分析与数据化运营 (pdf、epub、mobi、azw3)下载

下载地址:https://pan.baidu.com/s/1xQBVg5B8we6CbGuZU5_z3

分享码:7lh7

给大家带来的一篇关于Python数据相关的电子书资源,介绍了关于Python、数据分析、数据化运营方面的内容,本书是由机械工业出版社出版,格式根据源资源分为PDF、epub、mobi、azw3其中一种或多种格式,资源大小31.96 MB,宋天龙编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.1,更多相关的学习资源可以参阅 程序设计电子书Python电子书、等栏目。

Python数据分析与数据化运营 第二版 PDF

(1)创作者是有10多年数据统计分析与数字化经营工作经验的大数据专家,在世界各国公司都工作中过,阅历丰富。
(2)创作者擅于小结和创作,善于共享,编写数据统计分析类 畅销书3部。
(3)这书与类似书*大的不一样取决于,并不是只能纯碎的有关数据统计分析技术性和专用工具的解读,并且还与数据应用情景深层融合,在业务流程上真实可具体指导落地式。
(4)新版本除开Python升级来到*新版本外,主要内容上干了大幅的填补和提升,总体篇数超出30%,详细序言。
(5)这书创作者出示手机微信、电子邮箱等,可根据即时和线下二种方法立即为读者在线传道、受业、解答。它是1本将数据统计分析技术性与数据应用情景深层融合的经典著作,从实战演练视角解读了怎样运用Python开展数据统计分析和数字化经营。
畅销书全新升级、大幅度升級,第1版几近100%的五星好评,第2版不但将Python升級来到*新的版本号,并且对主要内容开展了大幅的填补和提升。创作者是有10多年数据统计分析与数字化经营的大数据专家,书中对50多个数据工作流引擎知识结构图、14个数据统计分析与发掘主题风格、4个数字化经营主题风格、8个综合型实例开展了全方位的解读,能让数字化经营融合数据应用情景360°落地式。

本书总共9章,分成2个一部分:
第壹一部分(第1-4章) Python数据统计分析与发掘
最先详细介绍了Python和数字化经营的基础知识,随后详尽解读了Python数据获得(结构型和非结构型)、预备处理、剖析和发掘的核心技术和工作经验,包括10类别预备处理工作经验、14个数据统计分析与发掘主题风格,50多个知识结构图。
其次一部分(第5~9章) Python数字化经营
它是这书的关键,详尽解读了vip会员经营、货品经营、总流量经营和内容营销4大主题风格,及其提高数字化经营使用价值的方式。每一经营主题风格中包括了基础知识、评定指标值、应用领域、数据统计分析实体模型、数据统计分析小窍门、数据统计分析大实话及其2个综合型的运用实例。
------
加上创作者手机微信(TonySong2013)可免费在线获得即时解释,另外添加这书沟通交流群(创作者拉进群),沟通交流大量数据工作中的感受和感受并了解大量同行业从业人员;这书出示实例数据和源码(汉语注解)免费下载,供用户实际操作时应用。

目录

  • 前言
  • 第1章 Python和数据化运营1
  • 1.1 用Python做数据化运营1
  • 1.1.1 Python是什么1
  • 1.1.2 数据化运营是什么2
  • 1.1.3 Python用于数据化运营5
  • 1.2 数据化运营所需的Python相关工具和组件5
  • 1.2.1 Python程序6
  • 1.2.2 Python交互环境Jupyter7
  • 1.2.3 Python第三方库23
  • 1.2.4 数据库和客户端29
  • 1.2.5 SSH远程客户端30
  • 1.3 内容延伸:Python的OCR和tensorflow31
  • 1.3.1 OCR工具:Tesseract-ocr31
  • 1.3.2 机器学习框架:TensorFlow31
  • 1.4 第1个用Python实现的数据化运营分析实例、销售预测32
  • 1.4.1 案例概述32
  • 1.4.2 案例过程32
  • 1.4.3 案例小结36
  • 1.5 本章小结37
  • 第2章 数据化运营的数据来源40
  • 2.1 数据化运营的数据来源类型40
  • 2.1.1 数据文件40
  • 2.1.2 数据库41
  • 2.1.3 API42
  • 2.1.4 流式数据43
  • 2.1.5 外部公开数据43
  • 2.1.6 其他来源44
  • 2.2 使用Python获取运营数据44
  • 2.2.1 从文本文件读取运营数据44
  • 2.2.2 从Excel获取运营数据55
  • 2.2.3 从关系型数据库MySQL读取运营数据57
  • 2.2.4 从非关系型数据库MongoDB读取运营数据64
  • 2.2.5 从API获取运营数据68
  • 2.3 内容延伸:读取非结构化网页、文本、图像、视频、语音72
  • 2.3.1 从网页中获取运营数据72
  • 2.3.2 读取非结构化文本数据73
  • 2.3.3 读取图像数据74
  • 2.3.4 读取视频数据78
  • 2.3.5 读取语音数据81
  • 2.4 本章小结85
  • 第3章 10条数据化运营不得不知道的数据预处理经验87
  • 3.1 数据清洗:缺失值、异常值和重复值的处理87
  • 3.1.1 数据列缺失的4种处理方法87
  • 3.1.2 不要轻易抛弃异常数据89
  • 3.1.3 数据重复就需要去重吗90
  • 3.1.4 代码实操:Python数据清洗92
  • 3.2 将分类数据和顺序数据转换为标志变量100
  • 3.2.1 分类数据和顺序数据是什么100
  • 3.2.2 运用标志方法处理分类和顺序变量101
  • 3.2.3 代码实操:Python标志转换101
  • 3.3 大数据时代的数据降维104
  • 3.3.1 需要数据降维的情况104
  • 3.3.2 基于特征选择的降维105
  • 3.3.3 基于特征转换的降维106
  • 3.3.4 基于特征组合的降维112
  • 3.3.5 代码实操:Python数据降维114
  • 3.4 解决样本类别分布不均衡的问题123
  • 3.4.1 哪些运营场景中容易出现样本不均衡124
  • 3.4.2 通过过抽样和欠抽样解决样本不均衡124
  • 3.4.3 通过正负样本的惩罚权重解决样本不均衡124
  • 3.4.4 通过组合/集成方法解决样本不均衡125
  • 3.4.5 通过特征选择解决样本不均衡125
  • 3.4.6 代码实操:Python处理样本不均衡125
  • 3.5 数据化运营要抽样还是全量数据128
  • 3.5.1 什么时候需要抽样128
  • 3.5.2 如何进行抽样129
  • 3.5.3 抽样需要注意的几个问题130
  • 3.5.4 代码实操:Python数据抽样131
  • 3.6 解决运营数据的共线性问题135
  • 3.6.1 如何检验共线性135
  • 3.6.2 解决共线性的5种常用方法136
  • 3.6.3 代码实操:Python处理共线性问题137
  • 3.7 有关相关性分析的混沌139
  • 3.7.1 相关和因果是一回事吗139
  • 3.7.2 相关系数低就是不相关吗139
  • 3.7.3 代码实操:Python相关性分析140
  • 3.8 标准化,让运营数据落入相同的范围141
  • 3.8.1 实现中心化和正态分布的Z-Score141
  • 3.8.2 实现归一化的Max-Min142
  • 3.8.3 用于稀疏数据的MaxAbs142
  • 3.8.4 针对离群点的RobustScaler142
  • 3.8.5 代码实操:Python数据标准化处理142
  • 3.9 离散化,对运营数据做逻辑分层145
  • 3.9.1 针对时间数据的离散化145
  • 3.9.2 针对多值离散数据的离散化146
  • 3.9.3 针对连续数据的离散化146
  • 3.9.4 针对连续数据的二值化147
  • 3.9.5 代码实操:Python数据离散化处理147
  • 3.10 内容延伸:非结构化数据的预处理151
  • 3.10.1 网页数据解析151
  • 3.10.2 网络用户日志解析159
  • 3.10.3 图像的基本预处理164
  • 3.10.4 自然语言文本预处理169
  • 3.11 本章小结172
  • 第4章 跳过运营数据分析和挖掘的“大坑”174
  • 4.1 聚类分析174
  • 4.1.1 当心数据异常对聚类结果的影响175
  • 4.1.2 超大数据量时应该放弃K均值算法175
  • 4.1.3 聚类不仅是建模的终点,更是重要的中间预处理过程177
  • 4.1.4 高维数据上无法应用聚类吗178
  • 4.1.5 如何选择聚类分析算法179
  • 4.1.6 案例:客户特征的聚类与探索性分析179
  • 4.2 回归分析196
  • 4.2.1 注意回归自变量之间的共线性问题197
  • 4.2.2 相关系数、判定系数和回归系数之间是什么关系197
  • 4.2.3 判定系数是否意味着相应的因果联系197
  • 4.2.4 注意应用回归模型时研究自变量是否产生变化198
  • 4.2.5 如何选择回归分析算法198
  • 4.2.6 案例:大型促销活动前的销售预测199
  • 4.3 分类分析206
  • 4.3.1 防止分类模型的过拟合问题207
  • 4.3.2 使用关联算法做分类分析207
  • 4.3.3 用分类分析来提炼规则、提取变量、处理缺失值208
  • 4.3.4 类别划分:分类算法和聚类算法都是好手209
  • 4.3.5 如何选择分类分析算法210
  • 4.3.6 案例:用户流失预测分析与应用210
  • 4.4 关联分析221
  • 4.4.1 频繁规则不一定是有效规则221
  • 4.4.2 不要被啤酒尿布的故事禁锢你的思维222
  • 4.4.3 被忽略的“负相关”模式真的毫无用武之地吗223
  • 4.4.4 频繁规则只能打包组合应用吗2

上一篇:Python接口自动化测试  下一篇:Python真好玩:教孩子学编程

展开 +

收起 -

Python数据 相关电子书
Python数据 学习笔记
网友NO.709466

R vs. Python数据分析详解

R和Python两者谁更适合数据分析领域?在某些特定情况下谁会更有优势?还是一个天生在各方面都比另一个更好? 当我们想要选择一种编程语言进行数据分析时,相信大多数人都会想到R和Python——但是从这两个非常强大、灵活的数据分析语言中二选一是非常困难的。 我承认我还没能从这两个数据科学家喜爱的语言中选出更好的那一个。因此,为了使事情变得有趣,本文将介绍一些关于这两种语言的详细信息,并将决策权留给读者。值得一提的是,有多种途径可以了解这两种语言各自的优缺点。然而在我看来,这两种语言之间其实有很强的关联。 Stack Overflow趋势对比 上图显示了自从2008年(Stack Overflow 成立)以来,这两种语言随着时间的推移而发生的变化。 R和Python在数据科学领域展开激烈竞争,我们来看看他们各自的平台份额,并将2016与2017年进行比较: 接下来我们将从适用场景、数据处理能力、任务、安装难度以及开放工具等方面详细了解这两种语言。 适用场景 R适用于数据分析任务需要独立计算或单个服务器的应用场景。Python作为一种粘合剂语言,在数据分析任务中需要与Web应用程序集成或者当一条统计代码需要插入到生产数据库中时,使用Python更好。 任务 在进行探索性统计分析时,R胜出。它非常适合初学者,统计……

网友NO.109420

Python数据结构与算法之图结构(Graph)实例分析

本文实例讲述了Python数据结构与算法之图结构(Graph)。分享给大家供大家参考,具体如下: 图结构(Graph)——算法学中最强大的框架之一。树结构只是图的一种特殊情况。 如果我们可将自己的工作诠释成一个图问题的话,那么该问题至少已经接近解决方案了。而我们我们的问题实例可以用树结构(tree)来诠释,那么我们基本上已经拥有了一个真正有效的解决方案了。 邻接表及加权邻接字典 对于图结构的实现来说,最直观的方式之一就是使用邻接列表。基本上就是针对每个节点设置一个邻接列表。下面我们来实现一个最简单的:假设我们现有 n 个节点,编号分别为 0, …, n-1. 节点当然可以是任何对象,可被赋予任何标签或名称。但使用 0, …, n-1 区间内的整数来实现的话,会简单许多。因为如果我们能用数字来代表节点,我们索引起来显然要方便许多。 然后,每个邻接(邻居)列表都只是一个数字列表,我们可以将它们编入一个大小为 n 的主列表,并用节点编号对其进行索引。由于这些列表内的节点的顺序是任意的,所以,实际上,我们是使用列表来实现邻接集(adjacency sets)。这里之所以还是使用列表这个术语,主要是因为传统。幸运的是,Python 本身就提供独立的 set 类型。 我们以下图为例,说明 图结构的各种表……

网友NO.145840

详解Python数据分析--Pandas知识点

本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘 1. 重复值的处理 利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID. import pandas as pd df = pd.DataFrame({"ID": ["A1000","A1001","A1002", "A1002"], "departmentId": [60001,60001, 60001, 60001]}) df.drop_duplicates() 2. 缺失值的处理 缺失值是数据中因缺少信息而造成的数据聚类, 分组, 截断等 2.1 缺失值产生的原因 主要原因可以分为两种: 人为原因和机械原因. 1) 人为原因: 由于人的主观失误造成数据的缺失, 比如数据录入人员的疏漏; 2) 机械原因: 由于机械故障导致的数据收集或者数据保存失败从而造成数据的缺失. 2.2 缺失值的处理方式 缺失值的处理方式通常有三种: 补齐缺失值, 删除缺失值, 删除缺失值, 保留缺失值. 1) 补齐缺失值: 使用计算出来的值去填充缺失值, 例如样本平均值. 使用fillna()函数对缺失值进行填充, 使用mean()函数计算样本平均值. import pandas as pdimport numpy as npdf = pd.DataFrame({'ID':['A10001', 'A10002', 'A10003', 'A10004'], "Salary":[11560, np.NaN, 12988,12080]})#用Salary字段的样本均值填充缺失值df["Salary"] = df["Salary"].fillna(df["Salary"].mean())df 2) 删除缺失值: 当数据量大时且缺失值占比较小可选用删除缺失值的记录. 示例: 删除entrytime中缺失的值,采用dropna函数对缺失值进行删除……

网友NO.491580

python数据分析买什么书

由于Python具有简单、易学、免费开源、可移植性、可扩展性等特点,所以它的受欢迎程度扶摇直上。再加上Python拥有非常丰富的库,这也使得它在数据分析领域有着越来越广泛的应用。如果你已经决定学习Python数据分析,但是之前没有编程经验,那么,这6本书将会是你的正确选择。 《Python科学计算》 (推荐学习:Python视频教程) 从发行版的安装开始,这本书将科学计算及可视化的常见函数库,如numpy、scipy、sympy、matplotlib、traits、tvtk、mayavi、opencv等等,都进行了较为详细地介绍。由于涉及面太广,可能对于单个函数库来说还不够深入,但是这本书能够让人快速上手,全面了解科学计算所用到的常用函数库。进而在此基础上选择自己需要的函数库进行深入学习,相对来说要容易得多。 《NumPyBeginner's Guide 2nd》 / 《 P ython数据分析基础教程:NumPy学习指南(第2版)》 面向新手的一本Numpy入门指南。整本书可谓是短小精干,条理清晰,将Numpy的基础内容讲得清清楚楚明明白白。此书的作者还写过一本《NumPyCookbook》/《NumPy攻略:Python科学计算与数据分析》,但这本书相比于前者,就显得结构有些杂乱,内容上也有些不上不下,如果要看的话,建议看完第一本再来看这本。在这里还想顺便吐槽一下这两本书的中文书名翻译。为了能……

码小辫

码小辫 发起

资源
22
粉丝
47
喜欢
350
评论
17

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明