相对于其他数据库系统或数据挖掘软件,微软最新推出的数据库系统Microsoft SQL Server借助自带的数据挖掘功能,较好地平衡了企业商务智能方案的性能和价格,因而在业界迅速普及。针对业界实务上的需求,本书主要介绍了如下内容:
●数据仓库、数据挖掘与商务智能之间的关系。
●Microsoft SQL Server的整体架构、分析服务和报告服务以及Microsoft SQL Server的整合服务和DMX语言。
●9种数据挖掘模型:决策树、贝叶斯分类、聚类分析、时序聚类、线性回归、Logistic回归、神经网络、时间序列。
本书给出了丰富的精彩实例,主要包括:
●利用聚类分析找出最具有投资价值的企业。
●利用决策树模型分析游戏《三国志4》武将数据,找出三国武将特性分布。
●利用线性回归分析了解成人血液中的胆固醇是否受体重、血压及年龄的影响,了解来店顾客人数是否受广告促销费用、店面面积以及店铺所在位置的影响。
●利用Logistic回归和神经网络分析影响病人肾细胞癌转移的临床病理因素。
●利用Logistic回归分析影响高中学生升学的因素。
●利用时间序列分析预测中国台湾地区未来的进出口货物价值,了解中国台湾地区未来的进出口货物的成长趋势,以及预测未来用电负荷,来整合整体电力使用规划。
本书涉及的数据文件可到华章网站(www.hzbook.com)和(www.acmr.com.cn/bi)下载。
封面图
目录
- 推荐序
- 序
- 第1章 绪论1
- 1.1 商业智能1
- 1.2 数据挖掘5
- 第2章 数据仓库7
- 2.1 数据仓库定义7
- 2.2 数据仓库特点7
- 2.3 数据仓库架构8
- 2.4 建立数据仓库的原因和目的10
- 2.5 数据仓库的应用10
- 2.6 数据仓库的管理11
- 第3章 数据挖掘简介13
- 3.1 数据挖掘的定义13
- 3.2 数据挖掘的重要性13
- 3.3 数据挖掘的功能13
- 3.4 数据挖掘的步骤14
- 3.5 数据挖掘建模的标准CRISP-DM15
- 3.6 数据挖掘软件分类17
- 3.7 各数据挖掘软件的分析方法简介18
- 第4章 数据挖掘中的主要方法23
- 4.1 回归分析23
- 4.2 关联规则25
- 4.3 聚类分析25
- 4.4 判别分析27
- 4.5 神经网络分析28
- 4.6 决策树分析29
- 4.7 其他分析方法30
- 第5章 数据挖掘与相关领域的关系32
- 5.1 数据挖掘与统计分析的不同32
- 5.2 数据挖掘与数据仓库的关系32
- 5.3 KDD与数据挖掘的关系33
- 5.4 OLAP与数据挖掘的关系34
- 5.5 数据挖掘与机器学习的关系34
- 5.6 Web数据挖掘和数据挖掘有什么不同35
- 第6章 SQL Server 2005中的商业智能36
- 6.1 SQL Server 2005入门36
- 6.2 关联型数据库37
- 6.3 Analysis Services39
- 第7章 SQL Server 2005中的数据挖掘
- 功能43
- 7.1 创建商业智能应用程序43
- 7.2 SQL Server 2005数据挖掘功能的
- 优势45
- 7.3 SQL Server 2005数据挖掘算法47
- 7.4 可扩展性47
- 7.5 SQL Server 2005数据挖掘功能与商业
- 智能集成47
- 7.6 使用数据挖掘可以解决的问题48
- 第8章 SQL Server 2005的分析服务52
- 8.1 建立数据源与数据源视图52
- 8.2 创建维度和多维数据集52
- 8.3 构建和部署53
- 8.4 从模板创建可自定义的数据库53
- 8.5 统一维度模型54
- 8.6 基于属性的维度54
- 8.7 维度类型55
- 8.8 量度组和透视56
- 8.9 计算和分析56
- 8.10 MDX脚本57
- 8.11 存储过程58
- 8.12 关键绩效指标58
- 8.13 实时商业智能59
- 第9章 SQL Server 2005的报表服务61
- 9.1 Reporting Services介绍61
- 9.2 为什么使用Reporting Services61
- 9.3 使用 Reporting Services 的方式62
- 9.4 Reporting Services的功能62
- 第10章 决策树模型66
- 10.1 基本概念66
- 10.2 决策树模型的建立66
- 10.3 决策树与判别函数的比较66
- 10.4 计算方法67
- 10.5 SQL Server 2005操作步骤69
- 10.6 范例分析79
- 第11章 贝叶斯分类84
- 11.1 基本概念84
- 11.2 SQL Server 2005操作步骤86
- 第12章 关联规则97
- 12.1 基本概念97
- 12.2 关联规则的种类98
- 12.3 关联规则的算法:Apriori98
- 12.4 SQL Server 2005操作步骤99
- 第13章 聚类分析111
- 13.1 基本概念111
- 13.2 层次聚类分析111
- 13.3 聚类分析原理112
- 13.4 SQL Server 2005操作步骤116
- 第14章 时序聚类分析126
- 14.1 基本概念126
- 14.2 相关研究126
- 14.3 SQL Server 2005操作步骤127
- 第15章 线性回归模型138
- 15.1 基本概念138
- 15.2 多元回归分析142
- 15.3 SQL Server 2005操作步骤145
- 15.4 范例分析一154
- 15.5 范例分析二158
- 第16章 Logistic回归模型163
- 16.1 基本概念163
- 16.2 logit变换163
- 16.3 Logistic分布164
- 16.4 列联表中的Logistic回归模型165
- 16.5 SQL Server 2005操作步骤166
- 16.6 范例分析一175
- 16.7 范例分析二180
- 第17章 神经网络模型186
- 17.1 基本概念186
- 17.2 神经网络的特性187
- 17.3 神经网络的架构与训练算法188
- 17.4 神经网络应用188
- 17.5 神经网络优缺点189
- 17.6 SQL Server 2005操作步骤189
- 17.7 范例分析199
- 第18章 时间序列模型204
- 18.1 基本概念204
- 18.2 时间序列的成分205
- 18.3 时间序列数据的图形介绍206
- 18.4 利用平滑法预测210
- 18.5 用趋势投影预测时间序列213
- 18.6 预测含有趋势成分与季节成分的
- 时间序列214
- 18.7 利用回归模型预测时间序列214
- 18.8 其他预测模型215
- 18.9 单变量时间序列预测模型215
- 18.10 时间趋势预测模型218
- 18.11 SQL Server 2005操作步骤219
- 18.12 范例分析228
- 第19章 SQL Server 2005整合服务232
- 19.1 SQL Server整合服务(SSIS)介绍232
- 19.2 SSIS实例练习239
- 第20章 文本挖掘模型259
- 20.1 文本挖掘技术的发展259
- 20.2 文本分析技术259
- 20.3 文本挖掘技术260
- 20.4 SQL Server 2005文本挖掘261
- 20.5 范例分析261
- 第21章 SQL Server 2005的DMX语言302
- 21.1 DMX介绍302
- 21.2 DMX函数介绍304
- 21.3 DMX数据挖掘语法311
- 21.4 DMX应用范例320
- 第22章 实际案例:聚类分析模型应用328
- 22.1 研究背景328
- 22.2 分析过程328
- 第23章 实际案例:时间序列模型应用336
- 23.1 研究背景336
- 23.2 分析过程336