大嘴巴漫谈数据挖掘(全彩) PDF 高清版

  • 更新时间:
  • 2286人关注
  • 点击下载

给大家带来的一篇关于数据挖掘相关的电子书资源,介绍了关于数据挖掘、大数据分析方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小32.79MB,易向军编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.3分

大嘴巴漫谈数据挖掘(全彩)

作者:易向军 著

出版时间:2014年版

《大嘴巴漫谈数据挖掘(全彩)》从最基本的概率统计学开始,全面、系统、形象而又深入地描述了数据挖掘的基础概念、应用领域以及常用算法。其中每一种数据挖掘算法都辅以通俗易懂的实例,读者能够在直观性、趣味性中学习算法的具体流程,明白算法的实现过程。通过《大嘴巴漫谈数据挖掘(全彩)》的学习,读者可以对数据挖掘的概念、应用和算法技术有一个清晰的理解和认识,并可以熟悉相关统计学的基本原理。《大嘴巴漫谈数据挖掘(全彩)》适合想从事数据挖掘方面的工作的初学者、数据分析爱好者、分析师,以及一线的数据挖掘开发人员参考阅读,也适合客户经理针对如何开展针对性的营销活动,避免客户流失而阅读学习,更适合产品经理阅读,因为针对如何预测产品的目标用户,促进用户活跃和业务有效使用,靠经验已经不行了,数据才最有说服力,更适合企业管理者将其作为一本通俗易懂的数据挖掘基础读物阅读学习,对下属的工作方向给予指导,以及适合教师学生数据挖掘课程辅导之用。

目录

  • 第一境昨夜西风凋碧树。独上高楼,望尽天涯路……
  • 1.1数据挖掘简介
  • 开篇点题引五问
  • 大数据中求价值
  • 定义概述归特点
  • 知识决策跨领域
  • 架构特征多形式
  • 数据立方展多维
  • 功能挖掘四大类
  • 分类刻画类标识
  • 数据聚类辨亲疏
  • 预测未来训模型
  • 关联源自购物篮
  • 模型过程方法论
  • 十大算法成经典
  • 1.2数据挖掘应用
  • 行业推广多应用
  • 用户为王放心中
  • 指导运营全周期
  • 定位目标寻用户
  • 精准营销成闭环
  • 交叉产品有关联
  • 细分用户刻画像
  • 用户体验模型化
  • 指标评测建体系
  • 流失预警保用户
  • 跟踪评估验效果
  • 第二境衣带渐宽终不悔,为伊消得人憔悴……
  • 2.1概率定义
  • 浮生难料尽偶然
  • 一枚硬币抛正反
  • 引出随机小试验
  • 样本空间样本点
  • 事件三分包万象
  • 试验频率需频繁
  • 次数无限值极限
  • 描述概率定特点
  • 古典概型等可能
  • 事件B后A在前
  • 求出概率称条件
  • 独立事件A和B
  • 抽签中奖公平性
  • 常用概率两公式
  • 交空并全划样本
  • 综合状态全概率
  • 前因后果贝叶斯
  • 2.2随机变量
  • 随机试验数量化
  • 统计规律双类型
  • 离散变量分布律
  • 硬币抛掷是一零
  • 分布函数连续型
  • 函数求导得密度
  • 高斯分布称正态
  • 标准正态分位点
  • 2.3数字特征
  • 随机变量有特征
  • 平均取值是期望
  • 方差衡量偏离值
  • 标准开根同量纲
  • 变量关系协方差
  • 相关系数相关度
  • 研究总体要抽样
  • 抽样分布统计量
  • 2.4参数估计
  • 最小二乘估参数
  • 极大似然大概率
  • 区间估计置信度
  • 2.5假设检验
  • 总体假设来检验
  • 服从正态抽样本
  • 统计量中验假设
  • 弃真取伪两错误
  • 显著检验小概率
  • 小概率中拒绝域
  • 检验流程出决策
  • 已知总体方差值
  • 检验中验均值
  • 第三境众里寻她千百度,蓦然回首,那人却在,灯火阑珊处。
  • 3.1关联规则
  • 购物篮中找关联
  • 数据事务若干项
  • 事务空间含项集
  • 置信支持提升度
  • 规则源于频繁项
  • k项连接和剪枝
  • 生成非空规则集
  • 关联效果来评估
  • 3.2决策树
  • 决策思维成树形
  • 分类预测工作流
  • 原理基于信息熵
  • 信息增益条件熵
  • 节点拆分选特征
  • 3.3贝叶斯
  • 预测分类贝叶斯
  • 类别概率要最大
  • 分类数据新预测
  • 3.4聚类分析
  • 物以类聚人以群
  • 样本变量定矩阵
  • R型Q型换空间
  • 距离度量相似度
  • 系数聚类统计量
  • 标准样本选欧氏
  • 层次聚合归大类
  • 3.5神经网络
  • 神经网络神经元
  • 神经元中有加权
  • 输入映射输出层
  • 求出误差调参数
  • 权重偏置学习率
  • 实例分析模型流
  • 3.6线性回归
  • 研究身高引回归
  • 单自变量归一元
  • 最小二乘估回归
  • 数据差异总离差
  • 分为解释和误差
  • 判定系数拟合度
  • 多元回归建方程
  • 回归面中展二元
  • 求得回归系数解
  • 衡量拟合验效果
  • 3.7逻辑回归
  • 因变量中二分类
  • 二项逻辑回归式
  • 极大似然解方程
  • 预测分类符合率
  • 3.8因子分析
  • 相关变量纳因子
  • 因子构造筑模型
  • 因子载荷统计性
  • 衡量信息共同度
  • 方差贡献重要性
  • 因子分析四步曲
  • 构造因子求载荷
  • 旋转因子得命名
  • 因子组合求得分
  • 3.9信度分析
  • 设计问卷来调研
  • 信度检验可靠性
  • 3.10效度分析
  • 结构方程协方差
  • 测量模型内外生
  • 结构模型潜变量
  • 效度分析路径图
  • 提出假设依理论
  • 固定负荷识模型
  • 相关阵中估参数
展开阅读
精选笔记:python数据挖掘需要学什么

13小时1分钟前回答

只要能解决实际问题,用什么工具来学习数据挖掘都是无所谓,这里首推Python。

python数据挖掘需要学什么

需要掌握Python中的哪些知识?(推荐学习:Python视频教程)

1、Pandas库的操作

Panda是数据分析特别重要的一个库,我们要掌握以下三点:

· pandas 分组计算;

· pandas 索引与多重索引;

索引比较难,但是却是非常重要的

· pandas 多表操作与数据透视表

2、numpy数值计算

numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容:

· Numpy array理解;

· 数组索引操作;

· 数组计算;

· Broadcasting(线性代数里面的知识)

3、数据可视化-matplotlib与seaborn

· Matplotib语法

python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。

· seaborn的使用

seaborn是一个非常漂亮的可视化工具。

· pandas绘图功能

前面说过pandas是做数据分析的,但它也提供了一些绘图的API。

4、数据挖掘入门

这部分是最难也是最有意思的一部分,要掌握以下几个部分:

· 机器学习的定义

在这里跟数据挖掘先不做区别

· 代价函数的定义

· Train/Test/Validate

· Overfitting的定义与避免方法

5、数据挖掘算法

数据挖掘发展到现在,算法已经非常多,下面只需掌握最简单的,最核心的,最常用的算法:

· 最小二乘算法;

· 梯度下降;

· 向量化;

· 极大似然估计;

· Logistic Regression;

· Decision Tree;

· RandomForesr;

· XGBoost;

6、数据挖掘实战

通过机器学习里面最着名的库scikit-learn来进行模型的理解。

更多Python相关技术文章,请访问Python教程栏目进行学习!

以上就是python数据挖掘需要学什么的详细内容,更多请关注码农之家其它相关文章!

展开阅读

资源下载

相关资源

  • Hadoop大数据挖掘从入门到进阶实战

    Hadoop大数据挖掘从入门到进阶实战

    博客园资深博主、极客学院金牌讲师多年Hadoop实战经验分享;详解Hadoop完整的技术体系:基础部署、集群管理、底层设计、项目实战;200分钟配套视频;51个实例,10个案例,大量避坑技巧

    大小:214.4 MBHadoop

    立即下载
  • 《IBM SPSS Modeler 18.0数据挖掘权威指南》素材,文件

    《IBM SPSS Modeler 18.0数据挖掘权威指南》素材,文件

    编辑推荐 联袂推荐n 暨南大学教授、博士生导师刘建平,暨南大学研究生院副院长、经济学院统计学系副主任、教授、博士生导师陈光慧,天善智能创始人梁勇,IBM技术专家刘咏梅,IBM数据科学家钟云飞,广东省环保厅环境咨询专家委员会专家、广东柯内特环境科技有限公司总经理朱斌n 本书特色n 内容全面:涉及数据读取、数据处理、数据可视化、统计分析与检验、数据挖掘算法、自动建模、集成与扩展、模型部署、性能优化、数据挖掘方法论等诸多内

    大小:74.37 MB数据挖掘

    立即下载
  • 数据挖掘:概念、模型、方法和算法

    数据挖掘:概念、模型、方法和算法

    《数据挖掘:概念、模型、方法和算法(第2版)》 开篇阐述数据挖掘原理,此后在示例的引导下详细讲解起源于统计学、机器学习、神经网络、模糊逻辑和演化计算等学科的具有代表性的、最

    大小:32.1 MB数据挖掘

    立即下载
  • 轻松学大数据挖掘:算法、场景与数据产品

    轻松学大数据挖掘:算法、场景与数据产品

    伴随着大数据时代的发展,数据价值的挖掘以及产品化逐渐被重视起来。《轻松学大数据挖掘:算法、场景与数据产品》作为该领域的入门教程,打破以往的数据工具与技术的介绍模式,凭借

    大小:75.5 MB大数据

    立即下载
  • 数据挖掘导论

    计算机与信息技术经历了半个世纪的发展,给人类社会带来了巨大的变化与影响。在支配人类社会三大要素(能源、材料和信息)中,信息愈来愈显示出其重要性和支配力,它将人类社会由工业化时代推向信息化时代。随着人类活动范围的扩展,生活节奏的加快,以及技术的进步,人们能以更快速更容易更廉价的方式获取和存储数据,这就使得数据及其信息量以指数方式增长。早在 世纪八十年代,据粗略估算,全球信息量每隔 个月就增加一倍。而进入九

    大小:2.5 MB数据挖掘

    立即下载
  • 基于R语言数据挖掘的统计与分析

    基于R语言数据挖掘的统计与分析

    R语言的功能越来越丰富,越来越多的人对R语言产生了兴趣。本书是为了让对R语言有兴趣的读者能更加了解R语言,了解大数据时代的数据挖掘等,感兴趣的可以下载学习

    大小:38.7 MBR语言

    立即下载
  • 量化投资:数据挖掘技术与实践

    量化投资:数据挖掘技术与实践

    全书内容分为三篇。第一篇(基础篇)主要介绍数据挖掘与量化投资的关系,以及数据挖掘的概念、实现过程、主要内容、主要工具等内容。感兴趣的可以下载学习

    大小:102 MBMATLAB

    立即下载

学习笔记

1小时42分钟前回答

python数据挖掘需要学的内容

1、Pandas库的操作 Panda是数据分析特别重要的一个库,我们要掌握以下三点: · pandas 分组计算; · pandas 索引与多重索引; 索引比较难,但是却是非常重要的 · pandas 多表操作与数据透视表 2、numpy数值计算 numpy数据计算主要应用是在数据挖掘,对于以后的机器学习,深度学习,这也是一个必须掌握的库,我们要掌握以下内容: · Numpy array理解; · 数组索引操作; · 数组计算; · Broadcasting(线性代数里面的知识) 3、数据可视化-matplotlib与seaborn · Matplotib语法 python最基本的可视化工具就是matplotlib。咋一看Matplotlib与matlib有点像,要搞清楚二者的关系是什么,这样学习起来才会比较轻松。 · seaborn的使用 seaborn是……

24小时38分钟前回答

深入分析python数据挖掘 Json结构分析

这篇文章通过实例给大家分析总结了python数据挖掘以及Json结构分析的相关知识点,对此有兴趣的朋友参考下。 json是一种轻量级的数据交换格式,也可以说是一种配置文件的格式 这种格式的文件是我们在数据处理经常会遇到的 python提供内置的模块json,只需要在使用前导入即可 你可以通过帮助函数查看json的帮助文档 json常用的方法有load、loads、dump以及dumps,这个都属于python初级,我不做过多解释 json可以结合数据库一起使用,在这以后要处理大量数据时非常有用 下面我们正式来利用数据挖掘对json文件进行处理 现在很多网站都运用了Ajax,所以一般很多都是XHR文件 通过这里我想利用一个地图网站来演示……