当前位置:主页 > 计算机电子书 > 大数据分析 > 数据分析下载
数据仓库与数据挖掘技术

数据仓库与数据挖掘技术 PDF 超清完整版

  • 更新:2021-08-27
  • 大小:34.61MB
  • 类别:数据分析
  • 作者:孙水华,赵钊林,刘建华
  • 出版:清华大学出版社
  • 格式:PDF

  • 资源介绍
  • 相关推荐

数据仓库与数据挖掘技术

作者: 孙水华,赵钊林,刘建华 著

出版时间: 2012

丛编项: 高等院校信息管理与信息系统专业系列教材

《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》主要介绍数据仓库和数据挖掘技术的基本概念、相关技术和应用案例及方法。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》共分为9章,主要包括:数据仓库与数据挖掘的概念和体系结构、数据仓库开发模型、etl技术、olap技术、商务智能系统、数据预处理技术、数据挖掘技术、数据仓库开发实例、报表设计等内容。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》各章节的案例均使用microsoftsqlserver2005进行操作实践讲解。通过对具体实例的学习和实践,使读者掌握数据仓库和数据挖掘中必要的知识点,达到学以致用的目的。《高等院校信息管理与信息系统专业系列教材:数据仓库与数据挖掘技术》适合作为高等院校本科学生的教材,也可供企业信息化管理人员、技术人员以及软件开发人员阅读参考。

目录

  • 第1章 数据仓库与数据挖掘概述
  • 1.1数据仓库的产生与发展
  • 1.1.1数据仓库的产生
  • 1.1.2数据仓库的发展
  • 1.1.3数据仓库的研究与开发现状
  • 1.1.4数据仓库的作用
  • 1.2数据仓库的基本概念
  • 1.2.1数据仓库的定义与基本特性
  • 1.2.2数据仓库与数据库的区别
  • 1.2.3数据仓库数据的组织架构
  • 1.3数据仓库的体系结构
  • 1.3.1虚拟的数据仓库体系结构
  • 1.3.2单独的数据仓库体系结构
  • 1.3.3单独的数据集市体系结构
  • 1.3.4分布式数据仓库结构
  • 1.4数据仓库的相关概念
  • 1.4.1数据源
  • 1.4.2数据的存储层
  • 1.4.3olap服务器
  • 1.4.4前端工具
  • 1.5数据挖掘技术概述
  • 1.5.1数据挖掘技术产生的背景
  • 1.5.2数据挖掘的基本概念
  • 1.5.3数据挖掘的对象
  • 1.5.4数据挖掘功能
  • 1.5.5数据挖掘与传统分析方法的区别
  • 1.5.6数据仓库与数据挖掘的关系
  • 1.5.7数据挖掘的发展趋势
  • 1.6数据挖掘过程
  • 1.6.1fayyad过程模型
  • 1.6.2crisp-dm过程模型
  • 1.6.3其他数据挖掘过程模型
  • 1.7常用的数据挖掘技术
  • 1.8小结
  • 1.9习题
  • 第2章 数据仓库开发模型
  • 2.1数据仓库开发模型概述
  • 2.2数据仓库的概念模型
  • 2.2.1企业模型的建立
  • 2.2.2规范的数据模型
  • 2.2.3常见的概念模型
  • 2.3数据仓库的逻辑模型
  • 2.3.1事实表模型设计
  • 2.3.2维度表模型设计
  • 2.4数据仓库的物理模型
  • 2.4.1物理模型的设计要点
  • 2.4.2数据仓库物理模型的存储结构
  • 2.4.3数据仓库物理模型的索引构建
  • 2.4.4数据仓库物理模型的优化问题
  • 2.5数据仓库的元数据模型
  • 2.5.1元数据的类型
  • 2.5.2元数据的作用
  • 2.5.3元数据的收集与维护
  • 2.5.4元数据的使用
  • 2.5.5元数据管理模型
  • 2.6数据仓库的粒度和聚集模型
  • 2.6.1数据仓库粒度模型
  • 2.6.2数据仓库聚集模型与数据分割
  • 2.7小结
  • 2.8习题
  • 第3章 etl技术
  • 3.1etl相关概念
  • 3.1.1数据理解
  • 3.1.2数据抽取
  • 3.1.3数据清洗
  • 3.1.4数据转换
  • 3.1.5数据加载
  • 3.2etl过程建模
  • 3.2.1etl系统面临的挑战
  • 3.2.2etl过程描述
  • 3.2.3etl概念模型
  • 3.2.4etl逻辑模型
  • 3.3etl增量抽取机制
  • 3.4etl过程数据质量控制
  • 3.4.1数据质量问题分类
  • 3.4.2数据质量控制技术
  • 3.5etl并行处理技术
  • 3.6小结
  • 3.7习题
  • 第4章 olap技术
  • 4.1olap概述
  • 4.1.1olap的定义
  • 4.1.2数据仓库与数据分析的关系
  • 4.1.3多维分析的基本概念
  • 4.1.4olap的多维数据分析
  • 4.1.5olap与oltp的比较
  • 4.2多维数据库及其存储
  • 4.2.1多维数据库
  • 4.2.2多维数据库的数据存储
  • 4.2.3多维数据库与数据仓库
  • 4.3olap的类型
  • 4.3.1多维olap
  • 4.3.2关系olap
  • 4.3.3混合型olap
  • 4.3.4molap与rolap的比较
  • 4.4olap的体系结构
  • 4.5olap中的索引技术
  • 4.5.1b-tree索引
  • 4.5.2位图索引
  • 4.5.3位图索引的扩展--标识符索引
  • 4.5.4索引性能比较
  • 4.5.5索引的选择
  • 4.6olap的评价标准
  • 4.6.1olap的衡量标准
  • 4.6.2olap服务器和工具的评价标准
  • 4.7olap的前端展现
  • 4.7.1olap工具
  • 4.7.2olap结果的展现方法
  • 4.8小结
  • 4.9习题
  • 第5章 商务智能系统
  • 5.1商务智能概述
  • 5.1.1商务智能的概念
  • 5.1.2商务智能的发展历程
  • 5.1.3商务智能的商业效益
  • 5.2商务智能系统架构
  • 5.2.1商务智能系统的核心技术
  • 5.2.1商务智能的体系结构
  • 5.3商务智能系统的功能
  • 5.4商务智能系统的应用
  • 5.4.1商务智能系统特点
  • 5.4.2我国商务智能系统应用现状分析
  • 5.5小结
  • 5.6习题
  • 第6章 数据预处理技术
  • 6.1数据预处理概述
  • 6.1.1数据预处理的必要性
  • 6.1.2数据预处理的基本方法
  • 6.1.3数据预处理的研究现状
  • 6.2数据清理
  • 6.2.1填充缺失值
  • 6.2.2光滑噪声数据
  • 6.2.3数据清理过程
  • 6.3数据集成
  • 6.4数据变换
  • 6.5数据归约
  • 6.5.1数据立方体聚集
  • 6.5.2属性子集选择
  • 6.5.3维度归约
  • 6.5.4数值归约
  • 6.5.5数据离散化与概念分层
  • 6.6小结
  • 6.7习题
  • 第7章 数据挖掘技术
  • 7.1概念描述
  • 7.1.1概念描述的生成过程
  • 7.1.2概念分层与数据泛化
  • 7.1.3概念分层方法
  • 7.1.4数据泛化方法
  • 7.1.5泛化的表示
  • 7.1.6属性相关分析
  • 7.1.7区别性描述
  • 7.2关联规则
  • 7.2.1关联规则相关概念
  • 7.2.2关联规则挖掘步骤
  • 7.2.3关联规则分类
  • 7.2.4关联规则的算法
  • 7.3数据分类
  • 7.3.1数据分类的基本步骤与评价准则
  • 7.3.2决策树
  • 7.3.3贝叶斯分类
  • 7.3.4神经网络方法
  • 7.3.5近邻分类方法
  • 7.4数据聚类
  • 7.4.1聚类分析概述
  • 7.4.2聚类算法的分类及其典型算法
  • 7.4.3聚类分析中的相似度度量方法
  • 7.4.4聚类分析中的聚类准则函数
  • 7.4.5k-means聚类算法
  • 7.5遗传算法
  • 7.5.1遗传算法的基本术语
  • 7.5.2遗传算法的执行过程
  • 7.5.3遗传算法应用举例
  • 7.5.4遗传算法的基本要素
  • 7.5.5遗传算法的特点及应用领域
  • 7.6粗糙集
  • 7.6.1粗糙集理论的相关概念
  • 7.6.2粗糙集的应用举例
  • 7.6.3粗糙集理论研究的对象及特点
  • 7.7小结
  • 7.8习题
  • 第8章 数据仓库开发实例
  • 8.1sql server 2005所提供的数据仓库功能
  • 8.1.1sql server 2005 integration services
  • 8.1.2sql server 2005 analysis services
  • 8.1.3sql server 2005 dw工具
  • 8.2福马特商店销售分析数据仓库系统的分析与设计
  • 8.3数据仓库的实现
  • 8.3.1sql server的数据仓库创建
  • 8.3.2olap的实施
  • 8.3.3数据仓库中的数据挖掘
  • 8.4数据仓库的应用与管理
  • 8.4.1数据仓库的用户
  • 8.4.2数据仓库应用案例
  • 8.4.3数据仓库的运行技术管理
  • 8.4.4数据仓库应用中的法律问题
  • 8.4.5数据仓库的成本与效益分析
  • 8.5小结
  • 8.6习题
  • 第9章 报表设计
  • 9.1报表概述
  • 9.1.1报表结构
  • 9.1.2传递报表
  • 9.1.3report server功能结构
  • 9.1.4report services的组成部分
  • 9.2报表向导制作报表
  • 9.2.1向导制作报表
  • 9.2.2报表设计器
  • 9.2.3部署报表
  • 9.3编辑制作报表
  • 9.3.1新建报表项目
  • 9.3.2新建数据集
  • 9.3.3报表格式设计
  • 9.3.4分组
  • 9.3.5钻取功能
  • 9.3.6文档结构图
  • 9.4矩阵式报表
  • 9.4.1数据集建立
  • 9.4.2矩阵布局
  • 9.4.3矩形布局
  • 9.4.4折叠结构
  • 9.5统计图表
  • 9.5.1图表元素
  • 9.5.2柱形图
  • 9.5.3折线图
  • 9.5.4饼图
  • 9.5.5圆环图
  • 9.6主体的多列
  • 9.7小结
  • 9.8实验
  • 参考文献

资源下载

资源下载地址1:https://pan.baidu.com/s/1Cd_v56pye2GcwPz3pAfCgQ

相关资源

网友留言