数据挖掘:你必须知道的32个经典案例

数据挖掘:你必须知道的32个经典案例 PDF 高清扫描版

  • 大小:45.7 MB
  • 类型:数据挖掘
  • 格式:PDF
  • 出版:电子工业出版社
  • 作者:任昱衡
  • 更新:2020-05-04 21:44:38
vip 立即下载( 45.7 MB )
关注公众号免费下载
版权投诉 / 资源反馈(本资源由用户 勾瀚海 投稿)

本站精选了一篇数据挖掘相关的资料,由电子工业出版社出版,作者是任昱衡,介绍了关于数据挖掘方面,格式为PDF,资源大小45.7 MB,目前在数据挖掘类资源综合评分为:8.1分。

书籍介绍

这书是为众多数据分析师量身定做的门读本,它致力于协助读者立在大数据时代的制高。数据分析处在应用统计学、计算机软件科学研究、运筹学、数据库查询等好几个行业的交叉式地区,大数据时代的来临大大的丰富多彩了数据分析的内函,数据分析师的岗位职责与过去对比发生了极大的更改。这书全方位详细介绍了經典数据分析、系统识别、深度学习、深度神经网络、数据挖掘、商务智能等好几个行业的数据分析算法,将大数据时代的数据分析热技术性一网尽。这书为每一个数据分析算法都配搭了一个成功案例,并依照由浅入深的标准搭建知识框架,充足照料了不一样水准读者的阅读习惯。根据阅读文章这书,读者将对大数据时代下的数据分析有一个全方位的了解。不论是门级的数据分析员還是有一定基本的数据分析师,都能根据这书健全、加重对数据分析的了解。这书是为众多数据分析师量身定做的门读本,它致力于协助读者立在大数据时代的制高。数据分析处在应用统计学、计算机软件科学研究、运筹学、数据库查询等好几个行业的交叉式地区,大数据时代的来临大大的丰富多彩了数据分析的内函,数据分析师的岗位职责与过去对比发生了极大的更改。这书全方位详细介绍了經典数据分析、系统识别、深度学习、深度神经网络、数据挖掘、商务智能等好几个行业的数据分析算法,将大数据时代的数据分析热技术性一网尽。这书为每一个数据分析算法都配搭了一个成功案例,并依照由浅入深的标准搭建知识框架,充足照料了不一样水准读者的阅读习惯。根据阅读文章这书,读者将对大数据时代下的数据分析有一个全方位的了解。不论是门级的数据分析员還是有一定基本的数据分析师,都能根据这书健全、加重对数据分析的了解。

这本书不规定读者的编程技术和数学思维训练,以尽可能浅显易懂的語言来表述晦涩难懂的数据挖掘算法基本原理,这书所保存的公式全是*基础的、迫不得已保存的公式计算,这将这书的阅读文章门坎降至了**。学习培训这书,读者将把握*好用的数据挖掘算法,并可以马上运用他们。

目录

  • 内容简介
  • 前言
  • 第1章 经典的探索性数据分析案例
  • 1.1 探索性数据分析综述
  • 1.2 数据巧收集——红牛的大数据营销案例
  • 1.2.1 状况百出的红牛企业
  • 1.2.2 红牛企业巧妙收集消费者数据
  • 1.2.3 数据收集小结
  • 1.3 数据可视化——数据新闻促使英军撤军
  • 1.3.1 维基解密带来的海量数据
  • 1.3.2 百花齐放的数据新闻
  • 1.3.3 数据可视化小结
  • 1.4 异常值分析——Facebook消灭钓鱼链接
  • 1.4.1 Facebook和广告商之间的拉锯战
  • 1.4.2 异常值分析指导排名算法工作
  • 1.4.3 异常值分析小结
  • 1.5 对比分析——TrueCar指导购物者寻找最合算的车价
  • 1.5.1 火中取栗的TrueCar网站
  • 1.5.2 数据对比赢得消费者信赖
  • 1.5.3 对比分析小结
  • 第2章 经典的相关分析与回归分析案例
  • 2.1 相关回归综述
  • 2.2 皮尔逊相关值——纽约市政府利用相关分析监控违法建筑
  • 2.2.1 简约而不简单的消防检测系统
  • 2.2.2 使用相关分析洞察60个变量的关系
  • 2.2.3 相关分析小结
  • 2.3 时间序列分析——人寿保险的可提费用预测
  • 2.3.1 人寿保险公司和可提费用
  • 2.3.2 使用四种时间序列回归预测模型解决问题
  • 2.3.3 时间序列分析小结
  • 2.4 线性回归分析——梅西百货公司的十二项大数据策略
  • 2.4.1 从“一亿豪赌”说起的零售商困境
  • 2.4.2 SAS公司帮助梅西百货构建模型
  • 2.4.3 线性回归分析小结
  • 2.5 Logistic回归分析——大面积流感爆发的预测分析
  • 2.5.1 究竟谁才是流感预测算法之王
  • 2.5.2 向Logistic算法中引入更多变量
  • 2.5.3 Logistic回归分析小结
  • 第3章 经典的降维数据分析案例
  • 3.1 降维分析算法综述
  • 3.2 粗糙集算法——协助希腊工业发展银行制定信贷政策
  • 3.2.1 银行信贷政策的制定原则
  • 3.2.2 粗糙集算法原理和应用
  • 3.2.3 粗糙集算法小结
  • 3.3 因子分析——基于李克特量表的应聘评价法
  • 3.3.1 源于智力测试的因子分析
  • 3.3.2 使用因子分析解构问卷
  • 3.3.3 因子分析小结
  • 3.4 最优尺度分析——直观评估消费者倾向的分析方法
  • 3.4.1 市场调查问题催生的最优尺度分析
  • 3.4.2 六种经典的最优尺度分析解读方法
  • 3.4.3 最优尺度分析小结
  • 3.5 PCA降维算法——智能人脸识别的应用与拓展
  • 3.5.1 刷脸的时代来了
  • 3.5.2 使用PCA算法完成降维工作
  • 3.5.3 PCA算法小结
  • 第4章 经典的模式识别案例
  • 4.1 模式识别综述
  • 4.2 图像分析——谷歌的超前自动驾驶技术
  • 4.2.1 以安全的名义呼吁自动驾驶技术
  • 4.2.2 快速成熟的无人驾驶技术
  • 4.2.3 图像分析小结
  • 4.3 遗传算法——经典的人力资源优化问题
  • 4.3.1 使用有限资源实现利益最大化
  • 4.3.2 遗传算法的计算过程
  • 4.3.3 遗传算法小结
  • 4.4 决策树分析——“沸腾时刻”准确判断用户健康水平
  • 4.4.1 打造我国最大健身平台
  • 4.4.2 信息增益和决策树
  • 4.4.3 决策树小结
  • 4.5 K均值聚类分析——HSE24通过为客户分类降低退货率
  • 4.5.1 在电子商务市场快速扩张的HSE24
  • 4.5.2 使用K均值聚类为客户分类
  • 4.5.3 K均值聚类小结
  • 第5章 经典的机器学习案例
  • 5.1 机器学习综述
  • 5.2 语义搜索——沃尔玛搜索引擎提升15%销售额
  • 5.2.1 注重用户体验的沃尔玛公司
  • 5.2.2 语义搜索引擎的底层技术和原理
  • 5.2.3 语义搜索技术小结
  • 5.3 顺序分析——搜狗输入法的智能纠错系统
  • 5.3.1 搜狗输入法的王牌词库和智能算法
  • 5.3.2 频繁树模式和顺序分析算法
  • 5.3.3 顺序分析小结
  • 5.4 文本分析——经典的垃圾邮件过滤系统
  • 5.4.1 大数据时代需要文本分析工作
  • 5.4.2 垃圾邮件过滤中的分词技术和词集模型
  • 5.4.3 文本分析小结
  • 5.5 协同过滤——构建个性化推荐系统的经典算法
  • 5.5.1 协同过滤算法为什么这么流行
  • 5.5.2 基于用户和基于产品的协同过滤
  • 5.5.3 协同过滤算法小结
  • 第6章 经典的深度学习案例
  • 6.1 深度学习综述
  • 6.2 支持向量机——乔布斯利用大数据对抗癌症
  • 6.2.1 乔布斯和胰腺癌的八年抗战
  • 6.2.2 医学统计学和支持向量机
  • 6.2.3 支持向量机小结
  • 6.3 感知器神经网络——最佳的房产价格预测算法
  • 6.3.1 如何在我国预测房价
  • 6.3.2 多层感知器和误差曲面
  • 6.3.3 感知器神经网络小结
  • 6.4 自组织神经网络——如何又快又好地解决旅行商问题
  • 6.4.1 最优路径问题的典型模式和解决方法
  • 6.4.2 自组织神经网络的拓扑结构和权值调整
  • 6.4.3 自组织神经网络小结
  • 6.5 RBM算法——为新闻报道智能分类
  • 6.5.1 新闻报道智能分类的难与易
  • 6.5.2 RBM算法的学习目标和学习方法
  • 6.5.3 RBM算法小结
  • 第7章 经典的数据挖掘案例
  • 7.1 数据挖掘综述
  • 7.2 判别分析——美国运通构建客户流失预测模型
  • 7.2.1 美国运通公司的旧日辉煌
  • 7.2.2 判别分析的假设条件和判别函数
  • 7.2.3 判别分析小结
  • 7.3 购物篮分析——找出零售业的最佳商品组合
  • 7.3.1 名动天下的“啤酒和尿布”案例
  • 7.3.2 购物篮分析的频繁模式
  • 7.3.3 购物篮分析小结
  • 7.4 马尔可夫链——准确预测客运市场占有率
  • 7.4.1 复杂的客运市场系统
  • 7.4.2 概率转移矩阵的求解方法
  • 7.4.3 马尔可夫链小结
  • 7.5 AdaBoost元算法——有效侦测欺诈交易的复合算法
  • 7.5.1 弱分类器和强分类器之争
  • 7.5.2 AdaBoost元算法的分类器构建方法
  • 7.5.3 AdaBoost元算法小结
  • 第8章 经典的商业智能分析案例
  • 8.1 商业智能分析综述
  • 8.2 KXEN分析软件——构建欧洲博彩业下注预测平台
  • 8.2.1 现代博彩业背后的黑手
  • 8.2.2 集体智慧和庄家赔率的联系
  • 8.2.3 KXEN软件小结
  • 8.3 数据废气再利用——物流公司数据成功用于评估客户信用
  • 8.3.1 数据废气和黑暗数据的异同
  • 8.3.2 论如何充分利用物流公司数据
  • 8.3.3 数据废气再利用小结
  • 8.4 必应预测——使用往期信息预测自然灾害
  • 8.4.1 预测自然灾害的必要性
  • 8.4.2 微软大数据预测的优与劣
  • 8.4.3 必应预测小结
  • 8.5 点球成金——助力NBA大数据分析的多种神秘软件
  • 8.5.1 NBA的有效球员数据
  • 8.5.2 有关点球成金的靠谱方法
  • 8.5.3 点球成金小结

以上就是本次关于书籍资源的介绍和部分内容,我们还整理了以往更新的其它相关电子书资源内容,可以在下方直接下载,关于相关的资源我们在下方做了关联展示,需要的朋友们也可以参考下。

数据挖掘相关资源

  • 量化投资:数据挖掘技术与实践

    量化投资:数据挖掘技术与实践

    全书内容分为三篇。第一篇(基础篇)主要介绍数据挖掘与量化投资的关系,以及数据挖掘的概念、实现过程、主要内容、主要工具等内容。感兴趣的可以下载学习

    大小:102 MBMATLAB电子书

  • 数据挖掘与预测分析

    数据挖掘与预测分析

    提供了从数据准备到探索新数据分析、数据建模及模型评估等整个数据分析过程的内容,提供了能够使读者利用现实世界数据集开展数据挖掘与预测分析的应用方法,欢迎下载

    大小:119.6 MB数据分析电子书

  • MATLAB数据分析与挖掘实战

    MATLAB数据分析与挖掘实战

    本书是按照先介绍案例背景与挖掘目标,再阐述分析方法与过程,最后完成模型构建的顺序进行的,在建模过程关键环节,穿插程序实现代码。最后通过上机实践,加深数据挖掘技术在案例应用

    大小:16.7 MBMATLAB电子书

  • 实战大数据:MATLAB数据挖掘详解与实践

    实战大数据:MATLAB数据挖掘详解与实践

    这是一本真正具备中国特色的数据挖掘手册,各种常规方法一应俱全,作者是高校教授,同时也是若干公司的数据挖掘顾问,难得的理论储备与实践经验都十分深厚,表达能力也很强,也了解痛点。基于这些背景创作的这本书,非常好。感兴趣的可以下载学习

    大小:171 MBMATLAB电子书

  • 社交网站的数据挖掘与分析

    社交网站的数据挖掘与分析

    社交网站数据如同深埋地下的金矿,如何利用这些数据来发现哪些人正通过社交媒介进行联系?他们正在谈论什么?或者他们在哪儿?本书第2版对上一版内容进行了全面更新和修订,它将揭示

    大小:51.9 MB数据分析电子书

  • 大数据搜索与日志挖掘及可视化方案

    大数据搜索与日志挖掘及可视化方案

    大数据的搜索与挖掘,在当今的互联网+时代是很有必要的。本书提出的分布式大数据搜索与日志挖掘及可视化方案是基于ELK Stack而提出的,它能有效应对海量大数据所带来的分布式存储与处理

    大小:45.3 MB数据挖掘电子书

  • 数据挖掘:概念与技术

    数据挖掘:概念与技术

    这书详细全方位地叙述大数据挖掘的定义、方式 、技术性和*研究进展。这书对前两版干了全方位修定,提升和再次机构了全书的技术性內容,重中之重阐述了数据预处理、经常方式发掘、归类

    大小:33.7 MB数据挖掘电子书

  • 数据挖掘:R语言实战

    数据挖掘:R语言实战

    本书侧重使用R 进行数据挖掘,重点讲述了R 的数据挖掘流程、算法包的使用及相关工具的应用,同时结合大量精选的数据挖掘实例对R 软件进行深入潜出和全面的介绍,以便读者能深刻理解R 的

    大小:57.6 MBR语言电子书

  • 数据挖掘技术

    数据挖掘技术

    《数据挖掘技术》 是基于数据挖掘经典算法及数据挖掘领域*研究技术进行数据分析的教材。全书内容包括数据挖掘概述、分类算法、聚类算法、关联规则算法及相应典型算法的算法描述及分析

    大小:62.6 MB数据挖掘电子书

  • R语言与数据挖掘

    R语言与数据挖掘

    这是公认的、权威的适合教学和零基础自学的R语言与数据挖掘教程,华南师范大学、广东工业大学、广西科技大学等20余所大学选为教材。即便你完全没有R语言编程基础和数据挖掘基础,根据

    大小:163 MBR语言电子书

  • 微型Lisp解释器的构造与实现

    微型Lisp解释器的构造与实现

    编辑推荐 中国人自己实现和维护的开源项目,成功将Haskell的Parsec解释器移植到Java和Scala。 内容简介 本书从零开始,将Haskell的Parsec解释器移植到Java和Scala,并通过详细的程序实例,深入浅出地介绍了组合子逻辑这个函数式编程的基本范式,给读者展示了Parsec组合子的原理、实现和应用。阅读本书,读者不但可以掌握Parsec解释器的实现方法,而且可以加深对Parsec组合子的理解。本书也可以作为学习Java和Scala编程语言的补充教材。 目录 前言 1 第1章 环境准

    大小:97.3 MBLisp

  • Linux超强归纳总结秘籍

    大小:414 KBLinux

  • C语言程序设计(第三版)

    C语言程序设计(第三版) 课后答案

    机实训、习题与解答、考试指南和题库练习系统、附录4个部分。第1部分包括Turbo C 2.0和Visual C++ 6.0环境介绍、与主教材配套的12章实训内容、两个综合实训;第2部分列出主教材所有习题并给出参考答案,并精选一些典型习题且给出分析与解答;第3部分包括对全国高校计算机水平考试、全国计算机等级考试的笔试和上机考试介绍与指导,以及题库练习系统使用方法介绍;第4部分附录包括动态内存分配和链表、变量跟踪法、等级考试和水平考试样卷、实训

    大小:1.38 MBC语言课后答案

  • 《ROS机器人高效编程(原书第3版)》源码

    《ROS机器人高效编程(原书第3版)》源码

    本书包含了大量示例,帮助你开发机器人程序,并为你提供使用开源ROS库和工具的完整解决方案。本书主要内容包括:ROS的概念、命令行工具、可视化GUI以及如何调试ROS,如何将机器人传感器和执行器连接到ROS,如何从摄像头和3D传感器获取数据并分析数据,如何在机器人/传感器和环境仿真中使用Gazebo,如何设计机器人,如何使用OpenCV3.0为机器人添加视觉功能,如何使用新版本的PCL向机器人添加3D感知功能。本书适合各个阶层的机器人开发人员和机器人

    大小:59.1 MBROS配套资源

  • 管理信息系统

    管理信息系统 课后答案

    《21世纪经济管理专业应用型精品教材:管理信息系统》分9个章节,详尽地讲述了管理信息系统的基本原理、开发方法与开发步骤。具体内容包括管理信息系统概述、管理信息系统的技术基础、管理信息系统的开发方法、系统规划、系统实施与管理等。全书突出理论与案例相结合,并配备电子教学课件和习题集,帮助学生切实掌握知识要点,并能灵活运用。同时,本教材也强调了信息系统的作用,信息系统与企业战略的关系,信息系统资源管理方面的基

    大小:2.54 MB管理信息系统课后答案

资源下载

相关声明:

数据挖掘学习笔记

10小时56分钟前回答

深入分析python数据挖掘 Json结构分析

这篇文章通过实例给大家分析总结了python数据挖掘以及Json结构分析的相关知识点,对此有兴趣的朋友参考下。 json是一种轻量级的数据交换格式,也可以说是一种配置文件的格式 这种格式的文件是我们在数据处理经常会遇到的 python提供内置的模块json,只需要在使用前导入即可 你可以通过帮助函数查看json的帮助文档 json常用的方法有load、loads、dump以及dumps,这个都属于python初级,……

1小时22分钟前回答

python数据挖掘需要学的内容

1、Pandas库的操作 Panda是数据分析特别重要的一个库,我们要掌握以下三点: · pandas 分组计算; · pandas 索引与多重索引; 索引比较难,但是却是非常重要的 · pandas 多表操作与数据透视表 2、numpy数值计算 numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容: · Numpy array理解; · 数组索引操作; · 数组计算; · ……

10小时26分钟前回答

python数据挖掘需要学什么

只要能解决实际问题,用什么工具来学习数据挖掘都是无所谓,这里首推Python。 需要掌握Python中的哪些知识? (推荐学习:Python视频教程) 1、Pandas库的操作 Panda是数据分析特别重要的一个库,我们要掌握以下三点: · pandas 分组计算; · pandas 索引与多重索引; 索引比较难,但是却是非常重要的 · pandas 多表操作与数据透视表 2、numpy数值计算 numpy数据计算主要应用是在数据挖掘,对……