当前位置：主页 > 计算机电子书 > 程序设计 > Python下载

Python数据科学：技术详解与商业实践

Python数据科学：技术详解与商业实践 PDF 影印版

更新：2019-06-11
大小：154 MB
类别：Python
作者：常国珍
出版：机械工业出版社
格式：PDF

资源介绍
学习心得
相关内容

Python数据科学：技术详解与商业实践

Python数据科学：技术详解与商业实践

读者评价

虽然我不是搞金融数据的，但这本书上的很多思路和方法却是可以借鉴的，希望以后能够多一些研究非金融类的其它行业的数据挖掘的人
课程和书同步的，上课免费拿了一本~课程讲的很详细，书就略过了一些琐碎的知识点了。非常全面，感觉是今年在数据方面特别好的内容了。非常推荐
近几年Python成为数据科学行业中大受欢迎的编程语言，初看了一下目前录，这本书为总结一下数据科学家和工程师几个最实用的python库以各种函数。如果你是正在学习Python的学生，我想你能从书中找到学习的重心。关键是这几个作者都还是蛮牛的数据科学专家。
客户洞察是分析型客户关系管理的核心，是实现客户智能的必要手段，其旨在增加CRM系统的商业分析与辅助决策能力。分析型CRM需要整合外部客户数据、渠道数据和大量交易数据，并从中提取出隐含有用的信息，这便是数据科学的用武之地。客户生命周期是客户洞察中最常用的分析工具，企业对初次接触的客户了解甚少，随着交往时间的延长，对其洞察越深入，分析主题越丰富。本课程就按照客户产品生命周期逐步展开数据科学的不同议题

内容介绍

本书共19章，第1章介绍数据科学中涉及的基本领域；第2～3章介绍与数据工作紧密相关的Python语言基础；第4章讲解描述性统计分析在宏观业务领域的分析；第5章讲解数据规整、清洗的重要技能；第6章介绍数据科学领域实用的四大统计检验；第7章讲解当被解释变量为连续变量时，如何使用线性回归作预测；第8章讲解使用逻辑回归作评分卡模型；第9章讲解另外一个可解释模型——决策树。第10～12章分别讲解了BP神经网络、朴素贝叶斯、近邻域、支持向量机的原理和在决策类模型中的运用；第13～14章作为一个整体讲解商业分析场景下的信息压缩；第15章以产品推荐作为案例，讲解发现事件与事件伴生关系的关联分析和序列分析算法；第16章使用欺诈识别案例讲解当被解释变量分布极端不平衡时的处理方法；第17章继续使用欺诈识别案例讲解集成学习算法；第18章讲解了使用效应分解和ARIMA方法实现宏观业务指标预测；第19章用案例展现了分类和聚类模型的CRISP-DM和SEMMA流程。

目录

前言
第1章数据科学家的武器库
1.1数据科学的基本概念
1.2数理统计技术
1.2.1描述性统计分析
1.2.2统计推断与统计建模
1.3数据挖掘的技术与方法
1.4描述性数据挖掘算法示例
1.4.1聚类分析——客户细分
1.4.2关联规则分析
1.5预测性数据挖掘算法示例
1.5.1决策树
1.5.2KNN算法
1.5.3Logistic回归
1.5.4神经网络
1.5.5支持向量机
1.5.6集成学习
1.5.7预测类模型讲解
1.5.8预测类模型评估概述
第2章Python概述
2.1Python概述
2.1.1Python简介
2.1.2Python与数据科学
2.1.3Python2与Python3
2.2Anaconda Python的安装、使用
2.2.1下载与安装
2.2.2使用Jupyter Notebook
2.2.3使用Spyder
2.2.4使用conda或pip管理
第三方库
第3章数据科学的Python编程基础
3.1Python的基本数据类型
3.1.1字符串(str)
3.1.2浮点数和整数（float、int）
3.1.3布尔值（Bool：True/False）
3.1.4其他
3.2Python的基本数据结构
3.2.1列表（list）
3.2.2元组（tuple）
3.2.3集合（set）
3.2.4字典（dict）
3.3Python的程序控制
3.3.1三种基本的编程结构简介
3.3.2顺承结构
3.3.3分支结构
3.3.4循环结构
3.4Python的函数与模块
3.4.1Python的函数
3.4.2Python的模块
3.5Pandas读取结构化数据
3.5.1读取数据
3.5.2写出数据
第4章描述性统计分析与绘图
4.1描述性统计进行数据探索
4.1.1变量度量类型与分布类型
4.1.2分类变量的统计量
4.1.3连续变量的分布与集中趋势
4.1.4连续变量的离散程度
4.1.5数据分布的对称与高矮
4.2制作报表与统计制图
4.3制图的步骤
第5章数据整合和数据清洗
5.1数据整合
5.1.1行列操作
5.1.2条件查询
5.1.3横向连接
5.1.4纵向合并
5.1.5排序
5.1.6分组汇总
5.1.7拆分、堆叠列
5.1.8赋值与条件赋值
5.2数据清洗
5.2.1重复值处理
5.2.2缺失值处理
5.2.3噪声值处理
5.3RFM方法在客户行为分析上的运用
5.3.1行为特征提取的RFM方法论
5.3.2使用RFM方法计算变量
5.3.3数据整理与汇报
第6章数据科学的统计推断基础
6.1基本的统计学概念
6.1.1总体与样本
6.1.2统计量
6.1.3点估计、区间估计和中心极限定理
6.2假设检验与单样本t检验
6.2.1假设检验
6.2.2单样本t检验
6.3双样本t检验
6.4方差分析（分类变量和连续变量关系检验）
6.4.1单因素方差分析
6.4.2多因素方差分析
6.5相关分析（两连续变量关系检验）
6.5.1相关系数
6.5.2散点矩阵图
6.6卡方检验（二分类变量关系检验）
6.6.1列联表
6.6.2卡方检验
第7章客户价值预测：线性回归模型与诊断
7.1线性回归
7.1.1简单线性回归
7.1.2多元线性回归
7.1.3多元线性回归的变量筛选
7.2线性回归诊断
7.2.1残差分析
7.2.2强影响点分析
7.2.3多重共线性分析
7.2.4小结线性回归诊断
7.3正则化方法
7.3.1岭回归
7.3.2LASSO回归
第8章Logistic回归构建初始信用评级
8.1Logistic回归的相关关系分析
8.2Logistic回归模型及实现
8.2.1Logistic回归与发生比
8.2.2Logistic回归的基本原理
8.2.3在Python中实现Logistic回归
8.3Logistic回归的极大似然估计
8.3.1极大似然估计的概念
8.3.2Logistics回归的极大似然估计
8.4模型评估
8.4.1模型评估方法
8.4.2ROC曲线的概念
8.4.3在Python中实现ROC曲线
第9章使用决策树进行初始信用评级
9.1决策树概述
9.2决策树算法
9.2.1ID3建树算法原理
9.2.2C4.5建树算法原理
9.2.3CART建树算法原理
9.2.4决策树的剪枝
9.3在Python中实现决策树
9.3.1建模
9.3.2模型评估
9.3.3决策树的可视化
9.3.4参数搜索调优
第10章神经网络
10.1神经元模型
10.2单层感知器
10.3BP神经网络
10.4多层感知器的scikitlearn代码实现
第11章分类器入门：最近邻域与朴素贝叶斯
11.1KNN算法
11.1.1KNN算法原理
11.1.2在Python中实现KNN算法
11.2朴素贝叶斯分类
11.2.1贝叶斯公式
11.2.2朴素贝叶斯分类原理
11.2.3朴素贝叶斯的参数估计
11.2.4在Python中实现朴素贝叶斯
第12章高级分类器：支持向量机
12.1线性可分与线性不可分
12.2线性可分支持向量机
12.2.1函数间隔和几何间隔
12.2.2学习策略
12.2.3对偶方法求解
12.2.4线性可分支持向量机例题
12.3线性支持向量机与软间隔最大化
12.4非线性支持向量机与核函数
12.4.1核函数
12.4.2非线性支持向量机的学习
12.4.3示例与Python实现
12.5使用支持向量机的案例
第13章连续变量的特征选择与转换
13.1方法概述
13.2主成分分析
13.2.1主成分分析简介
13.2.2主成分分析原理
13.2.3主成分分析的运用
13.2.4在Python中实现主成分分析
13.3基于主成分的冗余变量筛选
13.4因子分析
13.4.1因子分析模型
13.4.2因子分析算法
13.4.3在Python中实现因子分析
第14章客户分群与聚类
14.1聚类算法概述
14.2聚类算法基本概念
14.2.1变量标准化与分布形态转换
14.2.2变量的维度分析
14.3聚类模型的评估
14.4层次聚类
14.4.1层次聚类原理
14.4.2层次聚类在Python中的实现
14.5基于划分的聚类
14.5.1kmeans聚类原理
14.5.2kmeans聚类

资源获取

资源地址1：https://pan.baidu.com/s/1EJs44il9z08vcLLW5DbezQ

相关资源

网友留言

最近更新

热门资源