当前位置:首页 > 程序设计 >
《Python数据分析与数据化运营》电子书封面

Python数据分析与数据化运营

  • 发布时间:2019年10月19日 16:11:24
  • 作者:宋天龙
  • 大小:31.96 MB
  • 类别:Python数据电子书
  • 格式:PDF
  • 版本:第2版
  • 评分:9.2

    Python数据分析与数据化运营 PDF 第2版

      给大家带来的一篇关于Python数据相关的电子书资源,介绍了关于Python、数据分析、数据化运营方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小31.96 MB,宋天龙编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.6。

      内容介绍

      Python数据分析与数据化运营 第二版 PDF

      (1)创作者是有10多年数据统计分析与数字化经营工作经验的大数据专家,在世界各国公司都工作中过,阅历丰富。
      (2)创作者擅于小结和创作,善于共享,编写数据统计分析类 畅销书3部。
      (3)这书与类似书*大的不一样取决于,并不是只能纯碎的有关数据统计分析技术性和专用工具的解读,并且还与数据应用情景深层融合,在业务流程上真实可具体指导落地式。
      (4)新版本除开Python升级来到*新版本外,主要内容上干了大幅的填补和提升,总体篇数超出30%,详细序言。
      (5)这书创作者出示手机微信、电子邮箱等,可根据即时和线下二种方法立即为读者在线传道、受业、解答。它是1本将数据统计分析技术性与数据应用情景深层融合的经典著作,从实战演练视角解读了怎样运用Python开展数据统计分析和数字化经营。
      畅销书全新升级、大幅度升級,第1版几近100%的五星好评,第2版不但将Python升級来到*新的版本号,并且对主要内容开展了大幅的填补和提升。创作者是有10多年数据统计分析与数字化经营的大数据专家,书中对50多个数据工作流引擎知识结构图、14个数据统计分析与发掘主题风格、4个数字化经营主题风格、8个综合型实例开展了全方位的解读,能让数字化经营融合数据应用情景360°落地式。

      本书总共9章,分成2个一部分:
      第壹一部分(第1-4章) Python数据统计分析与发掘
      最先详细介绍了Python和数字化经营的基础知识,随后详尽解读了Python数据获得(结构型和非结构型)、预备处理、剖析和发掘的核心技术和工作经验,包括10类别预备处理工作经验、14个数据统计分析与发掘主题风格,50多个知识结构图。
      其次一部分(第5~9章) Python数字化经营
      它是这书的关键,详尽解读了vip会员经营、货品经营、总流量经营和内容营销4大主题风格,及其提高数字化经营使用价值的方式。每一经营主题风格中包括了基础知识、评定指标值、应用领域、数据统计分析实体模型、数据统计分析小窍门、数据统计分析大实话及其2个综合型的运用实例。
      ------
      加上创作者手机微信(TonySong2013)可免费在线获得即时解释,另外添加这书沟通交流群(创作者拉进群),沟通交流大量数据工作中的感受和感受并了解大量同行业从业人员;这书出示实例数据和源码(汉语注解)免费下载,供用户实际操作时应用。

      目录

      • 前言
      • 第1章 Python和数据化运营1
      • 1.1 用Python做数据化运营1
      • 1.1.1 Python是什么1
      • 1.1.2 数据化运营是什么2
      • 1.1.3 Python用于数据化运营5
      • 1.2 数据化运营所需的Python相关工具和组件5
      • 1.2.1 Python程序6
      • 1.2.2 Python交互环境Jupyter7
      • 1.2.3 Python第三方库23
      • 1.2.4 数据库和客户端29
      • 1.2.5 SSH远程客户端30
      • 1.3 内容延伸:Python的OCR和tensorflow31
      • 1.3.1 OCR工具:Tesseract-ocr31
      • 1.3.2 机器学习框架:TensorFlow31
      • 1.4 第1个用Python实现的数据化运营分析实例、销售预测32
      • 1.4.1 案例概述32
      • 1.4.2 案例过程32
      • 1.4.3 案例小结36
      • 1.5 本章小结37
      • 第2章 数据化运营的数据来源40
      • 2.1 数据化运营的数据来源类型40
      • 2.1.1 数据文件40
      • 2.1.2 数据库41
      • 2.1.3 API42
      • 2.1.4 流式数据43
      • 2.1.5 外部公开数据43
      • 2.1.6 其他来源44
      • 2.2 使用Python获取运营数据44
      • 2.2.1 从文本文件读取运营数据44
      • 2.2.2 从Excel获取运营数据55
      • 2.2.3 从关系型数据库MySQL读取运营数据57
      • 2.2.4 从非关系型数据库MongoDB读取运营数据64
      • 2.2.5 从API获取运营数据68
      • 2.3 内容延伸:读取非结构化网页、文本、图像、视频、语音72
      • 2.3.1 从网页中获取运营数据72
      • 2.3.2 读取非结构化文本数据73
      • 2.3.3 读取图像数据74
      • 2.3.4 读取视频数据78
      • 2.3.5 读取语音数据81
      • 2.4 本章小结85
      • 第3章 10条数据化运营不得不知道的数据预处理经验87
      • 3.1 数据清洗:缺失值、异常值和重复值的处理87
      • 3.1.1 数据列缺失的4种处理方法87
      • 3.1.2 不要轻易抛弃异常数据89
      • 3.1.3 数据重复就需要去重吗90
      • 3.1.4 代码实操:Python数据清洗92
      • 3.2 将分类数据和顺序数据转换为标志变量100
      • 3.2.1 分类数据和顺序数据是什么100
      • 3.2.2 运用标志方法处理分类和顺序变量101
      • 3.2.3 代码实操:Python标志转换101
      • 3.3 大数据时代的数据降维104
      • 3.3.1 需要数据降维的情况104
      • 3.3.2 基于特征选择的降维105
      • 3.3.3 基于特征转换的降维106
      • 3.3.4 基于特征组合的降维112
      • 3.3.5 代码实操:Python数据降维114
      • 3.4 解决样本类别分布不均衡的问题123
      • 3.4.1 哪些运营场景中容易出现样本不均衡124
      • 3.4.2 通过过抽样和欠抽样解决样本不均衡124
      • 3.4.3 通过正负样本的惩罚权重解决样本不均衡124
      • 3.4.4 通过组合/集成方法解决样本不均衡125
      • 3.4.5 通过特征选择解决样本不均衡125
      • 3.4.6 代码实操:Python处理样本不均衡125
      • 3.5 数据化运营要抽样还是全量数据128
      • 3.5.1 什么时候需要抽样128
      • 3.5.2 如何进行抽样129
      • 3.5.3 抽样需要注意的几个问题130
      • 3.5.4 代码实操:Python数据抽样131
      • 3.6 解决运营数据的共线性问题135
      • 3.6.1 如何检验共线性135
      • 3.6.2 解决共线性的5种常用方法136
      • 3.6.3 代码实操:Python处理共线性问题137
      • 3.7 有关相关性分析的混沌139
      • 3.7.1 相关和因果是一回事吗139
      • 3.7.2 相关系数低就是不相关吗139
      • 3.7.3 代码实操:Python相关性分析140
      • 3.8 标准化,让运营数据落入相同的范围141
      • 3.8.1 实现中心化和正态分布的Z-Score141
      • 3.8.2 实现归一化的Max-Min142
      • 3.8.3 用于稀疏数据的MaxAbs142
      • 3.8.4 针对离群点的RobustScaler142
      • 3.8.5 代码实操:Python数据标准化处理142
      • 3.9 离散化,对运营数据做逻辑分层145
      • 3.9.1 针对时间数据的离散化145
      • 3.9.2 针对多值离散数据的离散化146
      • 3.9.3 针对连续数据的离散化146
      • 3.9.4 针对连续数据的二值化147
      • 3.9.5 代码实操:Python数据离散化处理147
      • 3.10 内容延伸:非结构化数据的预处理151
      • 3.10.1 网页数据解析151
      • 3.10.2 网络用户日志解析159
      • 3.10.3 图像的基本预处理164
      • 3.10.4 自然语言文本预处理169
      • 3.11 本章小结172
      • 第4章 跳过运营数据分析和挖掘的“大坑”174
      • 4.1 聚类分析174
      • 4.1.1 当心数据异常对聚类结果的影响175
      • 4.1.2 超大数据量时应该放弃K均值算法175
      • 4.1.3 聚类不仅是建模的终点,更是重要的中间预处理过程177
      • 4.1.4 高维数据上无法应用聚类吗178
      • 4.1.5 如何选择聚类分析算法179
      • 4.1.6 案例:客户特征的聚类与探索性分析179
      • 4.2 回归分析196
      • 4.2.1 注意回归自变量之间的共线性问题197
      • 4.2.2 相关系数、判定系数和回归系数之间是什么关系197
      • 4.2.3 判定系数是否意味着相应的因果联系197
      • 4.2.4 注意应用回归模型时研究自变量是否产生变化198
      • 4.2.5 如何选择回归分析算法198
      • 4.2.6 案例:大型促销活动前的销售预测199
      • 4.3 分类分析206
      • 4.3.1 防止分类模型的过拟合问题207
      • 4.3.2 使用关联算法做分类分析207
      • 4.3.3 用分类分析来提炼规则、提取变量、处理缺失值208
      • 4.3.4 类别划分:分类算法和聚类算法都是好手209
      • 4.3.5 如何选择分类分析算法210
      • 4.3.6 案例:用户流失预测分析与应用210
      • 4.4 关联分析221
      • 4.4.1 频繁规则不一定是有效规则221
      • 4.4.2 不要被啤酒尿布的故事禁锢你的思维222
      • 4.4.3 被忽略的“负相关”模式真的毫无用武之地吗223
      • 4.4.4 频繁规则只能打包组合应用吗2

      学习笔记

      R vs. Python数据分析详解

      R和Python两者谁更适合数据分析领域?在某些特定情况下谁会更有优势?还是一个天生在各方面都比另一个更好? 当我们想要选择一种编程语言进行数据分析时,相信大多数人都会想到R和Python——但是从这两个非常强大、灵活的数据分析语言中二选一是非常困难的。 我承认我还没能从这两个数据科学家喜爱的语言中选出更好的那一个。因此,为了使事情变得有趣,本文将介绍一些关于这两种语言的详细信息,并将决策权留给读者。值得一提的是,有多种途径可以了解这两种语言各自的优缺点。然而在我看来,这两种语言之间其实有很强的关联。 Stack Overflow趋势对比 上图显示了自从2008年(Stack Overflow 成……

      Python数据结构与算法之图结构(Graph)实例分析

      本文实例讲述了Python数据结构与算法之图结构(Graph)。分享给大家供大家参考,具体如下: 图结构(Graph)——算法学中最强大的框架之一。树结构只是图的一种特殊情况。 如果我们可将自己的工作诠释成一个图问题的话,那么该问题至少已经接近解决方案了。而我们我们的问题实例可以用树结构(tree)来诠释,那么我们基本上已经拥有了一个真正有效的解决方案了。 邻接表及加权邻接字典 对于图结构的实现来说,最直观的方式之一就是使用邻接列表。基本上就是针对每个节点设置一个邻接列表。下面我们来实现一个最简单的:假设我们现有 n 个节点,编号分别为 0, …, n-1. 节点当然可以是任何对……

      详解Python数据分析--Pandas知识点

      本文主要是总结学习pandas过程中用到的函数和方法, 在此记录, 防止遗忘 1. 重复值的处理 利用drop_duplicates()函数删除数据表中重复多余的记录, 比如删除重复多余的ID. import pandas as pd df = pd.DataFrame({"ID": ["A1000","A1001","A1002", "A1002"], "departmentId": [60001,60001, 60001, 60001]}) df.drop_duplicates() 2. 缺失值的处理 缺失值是数据中因缺少信息而造成的数据聚类, 分组, 截断等 2.1 缺失值产生的原因 主要原因可以分为两种: 人为原因和机械原因. 1) 人为原因: 由于人的主观失误造成数据的缺失, 比如数据录入人员的疏漏; 2) 机械原因: 由于机械故障导致的数据收集或者数据保存失败从而造成数据的缺失. 2.2 缺失值的处理方式 缺失值……

      python数据分析买什么书

      由于Python具有简单、易学、免费开源、可移植性、可扩展性等特点,所以它的受欢迎程度扶摇直上。再加上Python拥有非常丰富的库,这也使得它在数据分析领域有着越来越广泛的应用。如果你已经决定学习Python数据分析,但是之前没有编程经验,那么,这6本书将会是你的正确选择。 《Python科学计算》 (推荐学习:Python视频教程) 从发行版的安装开始,这本书将科学计算及可视化的常见函数库,如numpy、scipy、sympy、matplotlib、traits、tvtk、mayavi、opencv等等,都进行了较为详细地介绍。由于涉及面太广,可能对于单个函数库来说还不够深入,但是这本书能够让人快速上手,全面了解科学计算所用到的常用函……

      以上就是本次介绍的Python数据电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:Python接口自动化测试

      下一篇:Python 快速入门

      展开 +

      收起 -

      • 《Python数据分析与数据化运营》PDF下载

      媛程序公众号

      重要!由于版权问题,暂停资源分享!关注左边的号有资料打包(惊喜!)

      添加左边“ 媛程序 ”的微信号,获取9月份下架资料打包!(每周更新)

      【资料整理(勿外传!)】

      Python数据相关电子书
      Python全栈数据工程师养成攻略
      Python全栈数据工程师养成攻略 超清视频版

      本书介绍了数据工程和Python语法,随后讲解如何获取和存储数据,并实现简单的静态可视化,帮助读者将学习到关于Web建站的一些基础和进阶知识

      立即下载
      Python数据科学导论
      Python数据科学导论 超清中文原版版

      这是一本优秀的数据科学入门教材,全面、系统阐述计算机驱动的数据科学相关知识,将教会你如何培养大脑洞察连接的能力,如何以事实为依据分析演绎出结论,以及如何从过去的经历中汲取经验,欢迎下载

      立即下载
      Python数据科学指南
      Python数据科学指南 清晰扫描版

      本书是Python数据分析编程入门,详细介绍了Python在数据科学中的应用,60多个实用的开发技巧,帮你探索Python及其强大的数据科学能力

      立即下载
      数据结构 Python语言描述
      数据结构 Python语言描述 完整源码版

      在电子信息科学中,数据结构是这门升阶性课程内容,定义抽象性,难度系数很大。Python语言的英语的语法简易,易用性强。用Python来解读数据结构等主题风格,比c语言等保持起來更加非常容

      立即下载
      Python数据科学:技术详解与商业实践
      Python数据科学:技术详解与商业实践 影印版

      本书共19章,第1章介绍数据科学中涉及的基本领域;第2~3章介绍与数据工作紧密相关的Python语言基础;第4章讲解描述性统计分析在宏观业务领域的分析;

      立即下载
      Python数据科学手册
      Python数据科学手册 超清扫描版

      这本书是以数据深度需求为中心的科学、研究以及针对计算和统计方法的参考书,讲述了个Python数据科学中的重点工具包、Matplotlib、NumPy等对象

      立即下载
      零起点Python大数据与量化交易
      零起点Python大数据与量化交易 高清版

      零起点Python大数据与量化交易 是国内较早关于Python大数据与量化交易的原创图书,配合zwPython开发平台和zwQuant开源量化软件学习,是一套完整的大数据分析、量化交易的学习教材,可直接用于

      立即下载
      读者留言
      码农之家

      码农之家 提供上传

      资源
      22
      粉丝
      24
      喜欢
      376
      评论
      10

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com