本书首先系统介绍了数据挖掘技术,然后虚拟一个“邦邦超市”,通过使用SQL语言建立该超市的数据库并对数据的进行操作,再进一步利用SQL Server 2008的数据挖掘模型对超市积累的数据进行挖掘,以实际例子帮助读者迅速理解并掌握数据挖掘技术、学会使用SQL Server 2008 提供的Data Mining工具、提高零售企业的信息利用能力和经营水平。
封面图
目录
- 前言
- 第1章数据挖掘与数据仓库1
- 1.1数据挖掘简介1
- 1.1.1数据挖掘的定义1
- 1.1.2数据挖掘的重要性1
- 1.1.3数据挖掘的功能1
- 1.1.4数据挖掘的步骤2
- 1.1.5数据挖掘建模的标准CRISP-DM2
- 1.2商务智能简介4
- 1.2.1商务智能4
- 1.2.2商务智能的定义4
- 1.2.3商务智能的架构5
- 1.2.4商务智能的实施流程5
- 1.3数据挖掘与其他相关领域的关系6
- 1.3.1数据挖掘与统计分析的不同6
- 1.3.2数据挖掘与数据仓库的关系6
- 1.3.3KDD与数据挖掘的关系7
- 1.3.4在线分析处理(OLAP)与数据挖掘的关系7
- 1.3.5数据挖掘与机器学习的关系8
- 1.3.6Web挖掘和数据挖掘有什么不同8
- 1.4数据挖掘在客户关系管理中的应用9
- 1.4.1客户关系管理(CRM)9
- 1.4.2客户关系管理指标10
- 1.4.3数据挖掘应用于各行业13
- 1.4.4客户市场细分14
- 1.4.5交叉销售15
- 1.4.6客户关系管理四大循环过程15
- 1.4.7数据库营销16
- 1.5数据仓库定义17
- 1.5.1数据仓库特性17
- 1.5.2数据仓库架构18
- 1.5.3构建数据仓库的原因19
- 1.5.4构建数据仓库的主要目的19
- 1.5.5数据仓库的应用20
- 1.5.6数据仓库的管理20
- 1.6数据挖掘工具分类21
- 1.6.1数据挖掘工具21
- 1.6.2各工具的简介21
- 第2章SQL语言介绍及其实例22
- 2.1SQL简介及数据变量来源说明22
- 2.1.1何谓SQL22
- 2.1.2各数据文档变量说明23
- 2.2SQL基本语法介绍25
- 2.3会员基本资料整理40
- 2.3.1查询县市别填答状态40
- 2.3.2婚姻状态42
- 2.4会员基本变项43
- 2.4.1性别43
- 2.4.2交易周期性变化49
- 2.4.3会员在交易时的年龄及婚姻状态52
- 2.4.4会员交易金额及红利积点次数分配百分比55
- 2.4.5平均交易间隔时间59
- 2.5产品组合62
- 2.5.1按照产品编号排行榜63
- 2.5.2单项产品的排行榜68
- 2.5.3重复购买率71
- 2.6会员流失率79
- 2.7会员贡献度83
- 第3章SQL Server 2008的数据挖掘模型在零售业中的应用86
- 3.1实际案例练习86
- 3.1.1数据挖掘Microsoft决策树87
- 3.1.2数据挖掘Microsoft罗吉斯回归90
- 3.1.3数据挖掘Microsoft类神经网络93
- 3.1.4数据挖掘Microsoft贝氏概率分类97
- 3.2潜在客户预测模型99
- 3.2.1潜在客户预测流程图99
- 3.2.2交易频率趋势图100
- 3.2.3交易频率语法101
- 3.3模型建构102
- 3.3.1SSIS操作流程102
- 3.3.2SSAS操作流程113
- 3.3.3数据挖掘Microsoft决策树模型建构118
- 3.3.4数据挖掘Microsoft罗吉斯回归模型建构128
- 3.3.5数据挖掘Microsoft类神经网络及贝氏概率模型建构130
- 3.3.6模型比较132
- 3.4数据挖掘Microsoft时间序列140
- 3.4.1基本概念140
- 3.4.2时间序列的成分142
- 3.4.3时间序列数据的图形介绍143
- 3.4.4利用修匀法预测147
- 3.4.5用趋势投射预测时间序列150
- 3.4.6预测含趋势与季节成分的时间序列151
- 3.4.7利用回归模型预测时间序列152
- 3.4.8其他预测模型153
- 3.4.9模型单变量时间序列预测模型153
- 3.4.10时间趋势预测模型155
- 3.4.11范例操作156
- 3.5数据挖掘Microsoft聚类分析165
- 3.5.1基本概念165
- 3.5.2范例操作167
- 3.6数据挖掘Microsoft线性回归182
- 3.6.1基本概念182
- 3.6.2简单线性回归分析184
- 3.6.3多元回归分析184
- 3.6.4岭回归分析184
- 3.6.5范例操作185
- 3.6.6补充(测试集数据汇出)205
- 3.7数据挖掘Microsoft关联规则208
- 3.7.1基本概念208
- 3.7.2关联规则的种类209
- 3.7.3关联规则的算法:Apriori算法209
- 3.7.4关联规则DMX数据挖掘语法210
- 3.8数据挖掘Microsoft时序群集211
- 3.8.1基本概念211
- 3.8.2相关研究211
- 3.8.3时序群集DMX数据挖掘语法212
- 第4章OLAP在零售业中的应用214
- 4.1数据仓库214
- 4.2实例操作217
- 4.2.1数据来源检查217
- 4.2.2创建命名查询(VIP会员数据)222
- 4.2.3编辑命名查询(VIP产品组成货号)224
- 4.2.4编辑命名查询(VIP订单明细表)225
- 4.2.5编辑命名查询(VIP订单数)225
- 4.2.6编辑命名查询(VIP购买产品)225
- 4.2.7编辑命名查询(VIP会员数)226
- 4.3维度设计227
- 4.4建立多维数据集238
- 4.4.1对企业的价值238
- 4.4.2数据储存的选择性239
- 4.4.3实例操作240
- 4.5数据模拟及相关数据明细249
- 第5章Excel中的数据挖掘模块253
- 5.1安装与设定数据挖掘加载宏253
- 5.1.1系统需求253
- 5.1.2开始安装253
- 5.1.3完成安装检查256
- 5.1.4状态设定256
- 5.1.5设定完成检查259
- 5.2Excel 2007数据挖掘工具列介绍260
- 5.2.1数据挖掘使用帮助260
- 5.2.2数据挖掘连接设定261
- 5.2.3设定目前的连接261
- 5.2.4跟踪263
- 5.2.5数据准备263
- 5.2.6浏览数据263
- 5.2.7清除数据266
- 5.2.8为数据分区267
- 5.2.9数据建模270
- 5.2.10准确性和验证270
- 5.2.11精确度图表270
- 5.2.12分类矩阵271
- 5.2.13利润图272
- 5.2.14模型使用方法272
- 5.2.15浏览272
- 5.2.16查询275
- 5.2.17模型管理275
- 5.2.18重命名此挖掘结构276
- 5.2.19删除此挖掘结构276
- 5.2.20清除此挖掘结构276
- 5.2.21使用原始数据处理此挖掘结构277
- 5.2.22用新数据处理此挖掘结构277
- 5.2.23导出此挖掘结构278
- 5.2.24导入278
- 附录279