数据挖掘:方法与应用 PDF 完整清晰版

  • 更新时间:
  • 9006人关注
  • 点击下载

给大家带来的一篇关于数据挖掘相关的电子书资源,介绍了关于数据挖掘、数据挖掘方法方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小29.43MB,徐华编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.1分

资源详情相关推荐
数据挖掘:方法与应用
  • 出版社:清华大学出版社
  • 作者:徐华
  • 大小:29.43MB
  • 类别:数据挖掘
  • 热度:978
  • 网站数据挖掘与分析:系统方法与商业实践
  • 数据挖掘导论
  • 基于不确定性建模的数据挖掘(英文版)
  • 数据挖掘:概念与技术(第3版)
  • 数据挖掘理论与实例
  • 这本《数据挖掘:方法与应用》主要根据作者徐华近几年在清华大学面向研究生和本科生开设的“ 数据挖掘:方法与应用”课程的教学实践与积累,参考近几年国外著名大学相关课程的教学体系,系统地介绍数据挖掘的基本概念和基本原理方法;结合一些典型的应用实例展示用数据挖掘的思维方法求解问题的一般性模式与思路。本书可作为有一定数据结构、数据库和程序设计基础的研究生或本科生开展数据挖掘知识学习和研究的入门性教材与参考读物。

    目录

    • 第1章绪论
    • 1.1 应用背景
    • 1.1.1 商业上的驱动
    • 1.1.2 科学研究上的驱动
    • 1.1.3 数据挖掘伴随着数据库技术而出现
    • 1.2 什么是数据挖掘
    • 1.2.1 基本描述
    • 1.2.2 关于知识发现
    • 1.3 数据挖掘的主要技术
    • 1.4 数据挖掘的主要研究内容
    • 1.5 数据挖掘面临的主要问题
    • 1.6 数据挖掘相关的资料
    • 1.7 本书的总体章节安排
    • 1.8 小结
    • 参考文献
    • 第2章数据预处理
    • 2.1 前言
    • 2.2 数据预处理的基本概念
    • 2.2.1 数据的基本概念
    • 2.2.2 为什么要进行数据预处理
    • 2.2.3 数据预处理的任务
    • 2.3 数据的描述
    • 2.3.1 描述数据的中心趋势
    • 2.3.2 描述数据的分散程度
    • 2.3.3 描述数据的其他方式
    • 2.4 数据清洗
    • 2.4.1 数据缺失的处理
    • 2.4.2 数据清洗
    • 2.5 数据集成和转换
    • 2.5.1 数据集成
    • 2.5.2 数据冗余性
    • 2.5.3 数据转换
    • 2.6 数据归约和变换
    • 2.6.1 数据归约
    • 2.6.2 数据离散化
    • 2.6.3 概念层次生成
    • 2.7 小结
    • 参考文献
    • 第3章数据仓库
    • 3.1 前言
    • 3.2 数据库基本概念回顾
    • 3.2.1 数据库简介
    • 3.2.2 表、记录和域
    • 3.2.3 数据库管理系统
    • 3.3 数据仓库简介
    • 3.3.1 数据仓库特点
    • 3.3.2 数据仓库概念
    • 3.3.3 数据仓库作用
    • 3.3.4 数据仓库与DBMS对比
    • 3.3.5 分离数据仓库的原因
    • 3.4 多维数据模型
    • 3.4.1 数据立方体
    • 3.4.2 概念模型
    • 3.4.3 概念分层
    • 3.4.4 典型OLAP操作
    • 3.4.5 星型网络的查询模型
    • 3.5 数据仓库结构
    • 3.5.1 数据仓库设计
    • 3.5.2 多层体系结构
    • 3.6 数据仓库的功能
    • 3.6.1 数据立方体的有效计算
    • 3.6.2 索引OLAP数据
    • 3.6.3 OLAP查询的有效处理
    • 3.7 从数据仓库到数据挖掘
    • 3.7.1 数据仓库应用
    • 3.7.2 从OLAP到
    • 3.8 小结
    • 参考文献
    • 第4章相关性与关联规则
    • 4.1 基本概念
    • 4.1.1 潜在的应用
    • 4.1.2 购物篮问题
    • 4.1.3 频繁模式分析、闭项集和关联规则
    • 4.2 频繁项集挖掘方法
    • 4.2.1 Apriori算法
    • 4.2.2 由频繁项集产生关联规则
    • 4.2.3 提高Apriori的效率
    • 4.2.4 挖掘频繁项集的模式增长方法
    • 4.3 多种关联规则挖掘
    • 4.3.1 挖掘多层关联规则
    • 4.3.2 挖掘多维关联规则
    • 4.3.3 挖掘量化关联规则
    • 4.4 从关联分析到相关分析
    • 4.4.1 相关分析
    • 4.4.2 强规则不一定是有价值的
    • 4.4.3 挖掘高度关联的模式
    • 4.5 基于约束的频繁模式挖掘
    • 4.5.1 关联规则的元规则制导挖掘
    • 4.5.2 基于约束的模式生成: 模式空间剪枝和数据空间剪枝
    • 4.6 小结
    • 参考文献
    • 第5章分类和预测
    • 5.1 前言
    • 5.2 基本概念
    • 5.2.1 什么是分类
    • 5.2.2 什么是预测
    • 5.3 关于分类和预测的问题
    • 5.3.1 准备分类和预测的数据
    • 5.3.2 评价分类和预测方法
    • 5.4 决策树分类
    • 5.4.1 决策树归纳
    • 5.4.2 属性选择度量
    • 5.4.3 提取分类规则
    • 5.4.4 基本决策树归纳的增强
    • 5.4.5 在大数据集中的分类
    • 5.5 贝叶斯分类
    • 5.5.1 贝叶斯定理
    • 5.5.2 朴素贝叶斯分类
    • 5.5.3 贝叶斯信念网络
    • 5.5.4 贝叶斯网络学习
    • 5.6 神经网络
    • 5.6.1 神经网络简介
    • 5.6.2 多层神经网络
    • 5.6.3 神经网络训练
    • 5.6.4 后向传播
    • 5.6.5 网络剪枝和规则抽取
    • 5.7 支持向量机
    • 5.7.1 数据线性可分的情况
    • 5.7.2 数据线性不可分的情况
    • 5.7.3 支持向量机和神经网络的对比
    • 5.8 关联分类
    • 5.8.1 为什么有效
    • 5.8.2 常见关联分类算法
    • 5.9 分类准确率
    • 5.9.1 估计错误率
    • 5.9.2 装袋和提升
    • 5.10 小结
    • 参考文献
    • 第6章聚类分析
    • 6.1 聚类分析的定义和数据类型
    • 6.1.1 聚类的定义
    • 6.1.2 聚类分析和主要应用
    • 6.1.3 聚类分析方法的性能指标
    • 6.1.4 聚类分析使用的数据类型
    • 6.2 流聚类方法分类与相似性质量
    • 6.2.1 聚类分析方法分类
    • 6.2.2 连续变量的距离与相似性度量
    • 6.2.3 二元变量与标称变量的相似性度量
    • 6.2.4 序数和比例标度变量的相似性度量
    • 6.2.5 混合类型变量的相似性度量
    • 6.3 基于分割的聚类
    • 6.4 基于层次的聚类
    • 6.5 基于密度的聚类
    • 6.6 基于网格的聚类
    • 6.7 基于模型的聚类
    • 6.8 离群点检测
    • 6.9 小结
    • 参考文献
    • 第7章数据挖掘应用
    • 7.1 前言
    • 7.2 应用研发思路
    • 7.3 预处理方法
    • 7.3.1 基础数据说明
    • 7.3.2 数字化方法说明
    • 7.3.3 深入一步的预处理方法
    • 7.3.4 基本数据分布情况说明
    • 7.3.5 初步分析结果
    • 7.3.6 小结
    • 7.4 特征提取方法
    • 7.4.1 8种特征提取方法
    • 7.4.2 特征总体排名策略
    • 7.4.3 最终关键特征
    • 7.4.4 特征提取与分析结论
    • 7.4.5 小结
    • 7.5 皮肤特征预测模型
    • 7.5.1 预测方法回顾
    • 7.5.2 预测结果分析与结论
    • 7.5.3 小结
    • 7.6 小结
    • 参考文献
    • 附录
    • 附录A插图索引
    • 附录B表格索引
    • 附录C算法索引
    • 附录D关键词索引
    展开阅读
    精选笔记:深入分析python数据挖掘 Json结构分析

    21小时23分钟前回答

    这篇文章通过实例给大家分析总结了python数据挖掘以及Json结构分析的相关知识点,对此有兴趣的朋友参考下。

    深入分析python数据挖掘 Json结构分析

    json是一种轻量级的数据交换格式,也可以说是一种配置文件的格式

    深入分析python数据挖掘 Json结构分析

    这种格式的文件是我们在数据处理经常会遇到的

    python提供内置的模块json,只需要在使用前导入即可

    深入分析python数据挖掘 Json结构分析

    你可以通过帮助函数查看json的帮助文档

    深入分析python数据挖掘 Json结构分析

    json常用的方法有load、loads、dump以及dumps,这个都属于python初级,我不做过多解释

    json可以结合数据库一起使用,在这以后要处理大量数据时非常有用

    下面我们正式来利用数据挖掘对json文件进行处理

    现在很多网站都运用了Ajax,所以一般很多都是XHR文件

    通过这里我想利用一个地图网站来演示

    深入分析python数据挖掘 Json结构分析

    我们通过浏览器的调试获取了相关url

    https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ

    下面我们通过requests模块中的get方法,模拟浏览器发出的http请求,并返回的到的结果对象

    代码如下

    # coding=utf-8
    __Author__ = "susmote"
    
    import requests
    url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"
    
    resp = requests.get(url)
    print(resp.text[0:200])

    在终端中运行结果如下

    深入分析python数据挖掘 Json结构分析

    数据已经获取到了,但是为了接下来能使用这些数据,我们需要利用json模块对这些数据进行分析

    代码如下

    import requests
    import json
    
    url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"
    
    resp = requests.get(url)
    
    json_dict = json.loads(resp.text)
    
    print(type(json_dict))
    
    print(json_dict.keys())

    简单讲一下上面的代码:

    导入json模块,然后调用loads方法,将返回的文本作为方法的参数传入

    在终端中运行结果如下

    深入分析python数据挖掘 Json结构分析

    可以看出,转换的结果是与json字符串对应的字典,因为type(json_dict)返回的是<class 'dict'>

    因为对象是一个字典,所以我们可以调用字典的方法,在这里我们调用的就是keys方法

    结果返回三个键,即status、searcOpt、data

    下面我们来查看data键里面的数据

    import requests
    import json
    
    url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"
    
    resp = requests.get(url)
    
    json_dict = json.loads(resp.text)
    
    print(json_dict['data'])

    下面在终端中运行这一段代码

    深入分析python数据挖掘 Json结构分析

    可以看到里面有很多我们需要的数据,如

    深入分析python数据挖掘 Json结构分析

    不一一标出,通过跟网页显示的相比较,就能清楚哪些是有用的了

    下面我们通过代码获取有用的信息,把它清晰的输出

    # coding=utf-8
    __Author__ = "susmote"
    
    import requests
    import json
    
    url = "https://ditu.amap.com/service/poiInfo?id=B001B0IZY1&query_type=IDQ"
    
    resp = requests.get(url)
    
    json_dict = json.loads(resp.text)
    
    data_dict = json_dict['data']
    
    data_list = data_dict['poi_list']
    
    dis_data = data_list[0]
    
    print('城市: ', dis_data['cityname'])
    print('名称: ', dis_data['name'])
    print('电话: ', dis_data['tel'])
    print('区号: ', dis_data['areacode'])
    print('地址: ', dis_data['address'])
    print('经度: ', dis_data['longitude'])
    print('纬度: ', dis_data['latitude'])


    因为返回的是一个字典,通过对文件结构的研究,字典中嵌套着列表,列表中又嵌套着字典,通过层层解套,成功获取数据

    我这里把步骤分开列出了,所以你会看的更加清楚

    下面我们通过终端运行程序,获取我们想要的信息

    深入分析python数据挖掘 Json结构分析

    是不是非常简单了,这个程序可以作为一个模版,获取其他地方的信息时只需要改一个url即可

    例如以下几个范例

    北京大学

    深入分析python数据挖掘 Json结构分析

    或者是腾讯大厦

    深入分析python数据挖掘 Json结构分析

    数据挖掘是没有尽头的,希望大家多分析数据,找到你想要的数据

    相关推荐:

    Python数据怎么处理numpy.median

    以上就是深入分析python数据挖掘 Json结构分析的详细内容,更多请关注码农之家其它相关文章!

    展开阅读

    资源下载

    相关资源

    • 数据挖掘与机器学习:WEKA应用技术与实践(第二版)

      数据挖掘与机器学习:WEKA应用技术与实践(第二版)

      本书过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,系统讲解Weka 3.7.13的操作、理论和应用,适合数据挖掘和机器学习相关人员作为技术参考书使用

      大小:135.1 MB数据挖掘

      立即下载
    • 数据仓库与数据挖掘工程实例

      数据仓库与数据挖掘工程实例

      数据仓库与数据挖掘是与计算机、信息类等相关 专业的核心课程。张兴会等编著的《数据仓库与数据 挖掘工程实例》采用提出问题、分析问题、解决问题 的思路,通过工程实例介绍了SQL Ser

      大小:22.6 MB数据挖掘

      立即下载
    • New Internet:大数据挖掘

      New Internet:大数据挖掘

      New Internet:大数据挖掘 作者:谭磊 著 出版时间:2013年版 《New Internet:大数据挖掘》全面地介绍了如何使用数据挖掘技术从各种结构的(数据库)或非结构(Web)的海量数据中提取和产生业务知识。作者梳理了各种数据挖掘常用算法和信息采集技术,系统地描述了实际应用时如何在互联网日志分析、电子邮件营销、互联网广告和电子商务上进行数据挖掘,着重介绍了数据挖掘的原理和算法在互联网海量数据挖掘中的应用。《New Internet:大数据挖掘》主要

      大小:43.42MB大数据挖掘

      立即下载
    • 大数据挖掘:系统方法与实例分析

      大数据挖掘:系统方法与实例分析

      大数据挖掘:系统方法与实例分析 是大数据挖掘领域的扛鼎之作,由全球科学计算领域的领导者MathWorks(MATLAB公司)官方的资深数据挖掘专家撰写,MathWorks官方及多位专家联袂推荐。 它从技术

      大小:57 MB大数据

      立即下载
    • 数据挖掘及其应用研究

      数据挖掘及其应用研究

      数据挖掘及其应用研究 作者:郑继刚 著 出版时间:2014年版 丛编项:滇西学术文丛 《滇西学术文丛:数据挖掘及其应用研究》全面介绍了数据挖掘的背景信息、相关概念及其所使用的主要技术,针对关联规则数据挖掘,系统深入地描述了Apriori算法和FP-growth算法,并比较了各自的优缺点。《滇西学术文丛:数据挖掘及其应用研究》基于关系代数的关联规则挖掘,讨论该算法的实现过程,并对该算法作复杂性分析,在聚类分析数据挖掘、序列模式挖掘等方

      大小:15.84MB数据挖掘

      立即下载
    • 数据挖掘技术

      数据挖掘技术

      《数据挖掘技术》 是基于数据挖掘经典算法及数据挖掘领域*研究技术进行数据分析的教材。全书内容包括数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析

      大小:62.6 MB数据挖掘

      立即下载

    学习笔记

    18小时50分钟前回答

    python数据挖掘需要学什么

    只要能解决实际问题,用什么工具来学习数据挖掘都是无所谓,这里首推Python。 需要掌握Python中的哪些知识? (推荐学习:Python视频教程) 1、Pandas库的操作 Panda是数据分析特别重要的一个库,我们要掌握以下三点: · pandas 分组计算; · pandas 索引与多重索引; 索引比较难,但是却是非常重要的 · pandas 多表操作与数据透视表 2、numpy数值计算 numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容: · Numpy array理解; · 数组索引操作; · 数组计算; · Broadcasting(线性代数里面的知识) 3、数据可视化-matplotlib与seaborn · Matplotib语法 python最基本的……

    8小时16分钟前回答

    python数据挖掘需要学的内容

    1、Pandas库的操作 Panda是数据分析特别重要的一个库,我们要掌握以下三点: · pandas 分组计算; · pandas 索引与多重索引; 索引比较难,但是却是非常重要的 · pandas 多表操作与数据透视表 2、numpy数值计算 numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容: · Numpy array理解; · 数组索引操作; · 数组计算; · Broadcasting(线性代数里面的知识) 3、数据可视化-matplotlib与seaborn · Matplotib语法 python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。 · seaborn的使用 seaborn是……