当前位置:首页 > 人工智能 >
《SQL机器学习库MADlib技术解析》电子书封面

SQL机器学习库MADlib技术解析

  • 发布时间:2019年10月25日 13:15:05
  • 作者:王雪迎
  • 大小:38.5 MB
  • 类别:MADlib电子书
  • 格式:PDF
  • 版本:完整原版
  • 评分:8.8

    SQL机器学习库MADlib技术解析 PDF 完整原版

      给大家带来的一篇关于MADlib相关的电子书资源,介绍了关于SQL、机器学习、MADlib、技术解析方面的内容,本书是由清华大学出版社出版,格式为PDF,资源大小38.5 MB,王雪迎编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.6。

      内容介绍

      SQL机器学习库MADlib技术解析 PDF

      做为一名数据库查询开发者或DBA,当应对聚类分析或主成分分析等难题时将会会一筹莫展。原因很简单,用經典SQL言语保持这种繁杂模型基础是不太可能的。如今,DBA运用MADlib,只需应用SQL查寻就能保持简易的机器学习,这也更是撰写这书的初心。MADlib与别的机器学习专用工具具备彻底不一样的设计构思。它并不是朝向程序猿的,只是朝向数据库查询开发者或DBA的,是根据SQL的互联网大数据机器学习库。MADlib将SQL的简易可维护性与机器学习的繁杂算法紧密结合,灵活运用了二者的优点和特性。针对众多传统式数据库查询运用专业技术人员而言,学习培训和从业机器学习工作中的门坎将大幅度降低。对客户来讲,MADlib提供了可在SQL查寻句子中启用的函数,不但包含基础的线性代数与运算和统计函数,还提供了常见的、制好的设备学习模型函数,保持了归类、聚类算法、关系、重归、预测分析、评定等运用中的常用算法。客户不用深层次掌握算法的程序实现关键点,要是弄清楚各函数中有关主要参数的含意、提供恰当的入参并可以了解和表述函数的輸出結果就能。MADlib是一套SQL中的互联网大数据机器学习库。一般SQL查寻能发觉统计数据*显著的方式和发展趋势,但是想读取数据中*为有效的信息内容,必须的则是一套坚固投身于数学课和应用数学的专业技能,这就是说机器学习。假如将SQL的简易实用与MADlib机器学习的繁杂算法结合在一起,就能保持简易的机器学习作用。 这书分成11章,从MADlib的基本要素、MADlib的构架、兼容的模型种类与作用下手,详尽分析MADlib各种各样模型的实际使用方法,包含数据类型、矩阵分解、数据转换、统计数据探寻、主成分分析、重归、时间序列分析、归类、聚类算法、关联规则、图算法、模型评定等。每个模型将从背景图专业知识、函数英语的语法、运用范例三层面开展 表明。 这书合适MADlib机器学习的新手、想学习培训MADlib机器学习的DBA及其从业数据统计分析与发掘的高級专业技术人员阅读文章,也合适高等学校与培训机构有关技术专业的老师学生课堂教学参照

      目录

      • 第1章  MADlib基础    1
      • 1.1  基本概念    1
      • 1.1.1  MADlib是什么    1
      • 1.1.2  MADlib的设计思想    2
      • 1.1.3  MADlib的工作原理    3
      • 1.1.4  MADlib的执行流程    4
      • 1.1.5  MADlib架构    5
      • 1.2  MADlib的功能    6
      • 1.2.1  MADlib支持的模型类型    6
      • 1.2.2  MADlib的主要功能模块    7
      • 1.3  MADlib的安装与卸载    9
      • 1.3.1  确定安装平台    9
      • 1.3.2  下载MADlib二进制压缩包    10
      • 1.3.3  安装MADlib    10
      • 1.3.4  卸载MADlib    12
      • 1.4  小结    13
      • 第2章  数据类型    14
      • 2.1  向量    14
      • 2.1.1  MADlib中的向量操作函数    15
      • 2.1.2  稀疏向量    23
      • 2.2  矩阵    30
      • 2.2.1  矩阵定义    31
      • 2.2.2  MADlib中的矩阵表示    31
      • 2.2.3  MADlib中的矩阵运算函数    32
      • 2.3  小结    49
      • 第3章  数据转换    50
      • 3.1  邻近度    50
      • 3.1.1  MADlib的邻近度相关函数    50
      • 3.1.2  距离度量的中心化和标准化    57
      • 3.1.3  选取正确的邻近度度量    58
      • 3.2  矩阵分解    59
      • 3.2.1  低秩矩阵分解    59
      • 3.2.2  奇异值分解    70
      • 3.3  透视表    87
      • 3.4  分类变量编码    97
      • 3.5  小结    110
      • 第4章  数据探索    111
      • 4.1  描述性统计    111
      • 4.1.1  皮尔森相关    111
      • 4.1.2  汇总统计    117
      • 4.2  概率统计    125
      • 4.2.1  概率    125
      • 4.2.2  统计推论    133
      • 4.3  主成分分析    147
      • 4.3.1  背景知识    147
      • 4.3.2  MADlib的PCA相关函数    149
      • 4.3.3  MADlib的PCA应用示例    155
      • 4.4  小结    160
      • 第5章  回归    161
      • 5.1  线性回归    161
      • 5.1.1  背景知识    161
      • 5.1.2  MADlib的线性回归相关函数    164
      • 5.1.3  线性回归示例    166
      • 5.2  非线性回归    171
      • 5.2.1  背景知识    171
      • 5.2.2  MADlib的非线性回归相关
      •       函数    172
      • 5.2.3  非线性回归示例    175
      • 5.3  逻辑回归    179
      • 5.3.1  背景知识    179
      • 5.3.2  MADlib的逻辑回归相关函数    180
      • 5.3.3  逻辑回归示例    182
      • 5.4  多类回归    187
      • 5.4.1  背景知识    187
      • 5.4.2  MADlib的多类回归相关函数    190
      • 5.4.3  多类回归示例    192
      • 5.5  序数回归    196
      • 5.5.1  背景知识    196
      • 5.5.2  MADlib的序数回归相关函数    197
      • 5.5.3  序数回归示例    200
      • 5.6  弹性网络回归    202
      • 5.6.1  背景知识    202
      • 5.6.2  MADlib的弹性网络回归相关
      •       函数    204
      • 5.6.3  弹性网络回归示例    209
      • 5.7  小结    221
      • 第6章  时间序列分析    222
      • 6.1  背景知识    222
      • 6.1.1  时间序列分析方法    222
      • 6.1.2  ARIMA模型    223
      • 6.2  MADlib中ARIMA相关函数    225
      • 6.3  时间序列分析示例    228
      • 6.4  小结    232
      • 第7章  分类    233
      • 7.1  K近邻    233
      • 7.1.1  背景知识    233
      • 7.1.2  MADlib中K近邻函数    235
      • 7.1.3  K近邻示例    236
      • 7.2  朴素贝叶斯    240
      • 7.2.1  背景知识    240
      • 7.2.2  MADlib中朴素贝叶斯分类
      •       相关函数    242
      • 7.2.3  朴素贝叶斯分类示例    244
      • 7.3  支持向量机    249
      • 7.3.1  背景知识    249
      • 7.3.2  MADlib的支持向量机相关
      •       函数    252
      • 7.3.3  支持向量机示例    258
      • 7.4  决策树    264
      • 7.4.1  背景知识    264
      • 7.4.2  MADlib的决策树相关函数    267
      • 7.4.3  决策树示例    272
      • 7.5  随机森林    281
      • 7.5.1  背景知识    281
      • 7.5.2  MADlib的随机森林相关函数    282
      • 7.5.3  随机森林示例    287
      • 7.6  小结    293
      • 第8章  聚类    294
      • 8.1  背景知识    294
      • 8.1.1  聚类的概念    294
      • 8.1.2  k-means方法    295
      • 8.2  MADlib的k-means相关函数    297
      • 8.2.1  训练函数    298
      • 8.2.2  簇分配函数    300
      • 8.2.3  轮廓系数函数    301
      • 8.3  k-means示例    301
      • 8.4  小结    307
      • 第9章  关联规则    308
      • 9.1  背景知识    308
      • 9.1.1  基本概念    308
      • 9.1.2  Apriori算法    311
      • 9.2  MADlib的Apriori算法函数    312
      • 9.3  Apriori应用示例    313
      • 9.4  小结    319
      • 第10章  图算法    320
      • 10.1  背景知识    320
      • 10.1.1  基本概念    320
      • 10.1.2  常见图算法    321
      • 10.1.3  单源最短路径    323
      • 10.2  MADlib的单源最短路径相关函数    324
      • 10.3  单源最短路径示例    325
      • 10.4  小结    327
      • 第11章  模型评估    328
      • 11.1  交叉验证    328
      • 11.1.1  背景知识    328
      • 11.1.2  MADlib的交叉验证相关
      • 函数    331
      • 11.1.3  交叉验证示例    333
      • 11.2  预测度量    336
      • 11.3  小结    342

      学习笔记

      Python机器学习logistic回归代码解析

      本文主要研究的是Python机器学习logistic回归的相关内容,同时介绍了一些机器学习中的概念,具体如下。 Logistic回归的主要目的 :寻找一个非线性函数sigmod最佳的拟合参数 拟合、插值和逼近是数值分析的三大工具 回归: 对一直公式的位置参数进行估计 拟合 :把平面上的一些系列点,用一条光滑曲线连接起来 logistic主要思想: 根据现有数据对分类边界线建立回归公式、以此进行分类 sigmoid函数: 在神经网络中它是所谓的激励函数。当输入大于0时,输出趋向于1,输入小于0时,输出趋向0,输入为0时,输出为0.5 梯度上升 :要找到某个函数的最大值,最好的方法是沿着该函数的梯度方向探寻 收敛: 随着……

      机器学习python实战之手写数字识别

      看了上一篇内容之后,相信对K近邻算法有了一个清晰的认识,今天的内容——手写数字识别是对上一篇内容的延续,这里也是为了自己能更熟练的掌握k-NN算法。 我们有大约2000个训练样本和1000个左右测试样本,训练样本所在的文件夹是trainingDigits,测试样本所在的文件夹是testDigits。文本文件中是0~9的数字,但是是用二值图表示出来的,如图。我们要做的就是使用训练样本训练模型,并用测试样本来检测模型的性能。 首先,我们需要将文本文件中的内容转化为向量,因为图片大小是32*32,所以我们可以将其转化为1*1024的向量。具体代码实现如下: def img2vector(filename): imgVec = zeros((1,1024)) file = open(filename……

      python机器学习实战之树回归详解

      本文实例为大家分享了树回归的具体代码,供大家参考,具体内容如下 #-*- coding:utf-8 -*- #!/usr/bin/python ''''' 回归树 连续值回归预测 的 回归树 ''' # 测试代码 # import regTrees as RT RT.RtTreeTest() RT.RtTreeTest('ex0.txt') RT.RtTreeTest('ex2.txt') # import regTrees as RT RT.RtTreeTest('ex2.txt',ops=(10000,4)) # import regTrees as RT RT.pruneTest() # 模型树 测试 # import regTrees as RT RT.modeTreeTest(ops=(1,10) # 模型回归树和普通回归树 效果比较 计算相关系数 # import regTrees as RT RT.MRTvsSRT() from numpy import * # Tab 键值分隔的数据 提取成 列表数据集 成浮点型数据 def loadDataSet(fileName): # dataMat = [] # 目标数据集 列表 fr = open(fileName) for line in fr.readlines(): curLine = line.stri……

      Python机器学习之scikit-learn库中KNN算法的封装与使用方法

      本文实例讲述了Python机器学习之scikit-learn库中KNN算法的封装与使用方法。分享给大家供大家参考,具体如下: 1、工具准备,python环境,pycharm 2、在机器学习中,KNN是不需要训练过程的算法,也就是说,输入样例可以直接调用predict预测结果,训练数据集就是模型。当然这里必须将训练数据和训练标签进行拟合才能形成模型。 3、在pycharm中创建新的项目工程,并在项目下新建KNN.py文件。 import numpy as npfrom math import sqrtfrom collections import Counterclass KNNClassifier: def __init__(self,k): """初始化KNN分类器""" assert k = 1 """断言判断k的值是否合法""" self.k = k self._X_train = None self._y_train = None def fit(self,X_train,y_train): """根据训练……

      以上就是本次介绍的MADlib电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:计算机视觉增强现实应用程序开发

      下一篇:演说之法:PPT高手思维秘籍

      展开 +

      收起 -

      • 《SQL机器学习库MADlib技术解析》PDF下载

      媛程序公众号

      重要!由于版权问题,暂停资源分享!关注左边的号有资料打包(惊喜!)

      关注左边“ 媛程序 ”的公众号,获取8月份各机构资料打包下载!(每周更新)

      内容包含:电子书、CSDN资源、视频资源……

      MADlib相关电子书
      机器学习在线:解析阿里云机器学习平台
      机器学习在线:解析阿里云机器学习平台 全书完整版 立即下载
      Python机器学习算法
      Python机器学习算法 原书扫描版

      这是一本机器学习入门读物,注重理论与实践的结合,以典型的机器学习算法为例,从算法原理出发,由浅入深,详细介绍算法的理论,并配合目前流行的Python语言,从零开始,增强实际的算法实践能力

      立即下载
      美团机器学习实践
      美团机器学习实践 扫描版

      人工智能机器学习算法落地实践指南 内容涵盖搜索 推荐 风控 计算广告 图像处理等领域 展示美团技术底蕴 系统阐述大型互联网公司机器学习真实场景实践

      立即下载
      数据挖掘与机器学习:WEKA应用技术与实践
      数据挖掘与机器学习:WEKA应用技术与实践 原书第二版

      本书过大量的实践操作,使读者了解并掌握数据挖掘和机器学习的相关技能,系统讲解Weka 3.7.13的操作、理论和应用,适合数据挖掘和机器学习相关人员作为技术参考书使用

      立即下载
      Spark MLlib机器学习:算法、源码及实战详解
      Spark MLlib机器学习:算法、源码及实战详解 高清扫描版

      《Spark MLlib机器学习:算法、源码及实战详解》以Spark 1.4.1版本源码为切入点,全面并且深入地解析Spark MLlib模块,着力于探索分布式机器学习的底层实现。 《Spark MLlib机器学习:算法、源码及

      立即下载
      机器学习实战:基于Scikit-Learn和TensorFlow
      机器学习实战:基于Scikit-Learn和TensorFlow 扫描版

      本书作者曾经是谷歌工程师,在2013年至2016年主导了YouTube的视频分类工程,拥有丰富的机器学习项目经验。本书从开发者的实践角度,在动手写代码的过程中,循序渐进地了解机器学习的理论知

      立即下载
      Python机器学习及实践:从零开始通往Kaggle竞赛之路
      Python机器学习及实践:从零开始通往Kaggle竞赛之路 高清版

      Python机器学习及实践 面向所有对机器学习与数据挖掘的实践及竞赛感兴趣的读者,从零开始,以Python编程语言为基础,在不涉及大量数学模型与复杂编程知识的前提下,逐步带领读者熟悉并且

      立即下载
      读者留言
      码农之家

      码农之家 提供上传

      资源
      15
      粉丝
      48
      喜欢
      188
      评论
      5

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com