标签分类
当前位置:首页 > 人工智能电子书 > MADlib电子书网盘下载
SQL机器学习库MADlib技术解析

SQL机器学习库MADlib技术解析 完整原版电子书

官方价: 44.8

更 新:

SQL机器学习库MADlib技术解析 (pdf、epub、mobi、azw3)下载

下载地址:https://pan.baidu.com/s/1jHFQdOnpwy0sK54LMXPJ_

分享码:v9e8

给大家带来的一篇关于MADlib相关的电子书资源,介绍了关于SQL、机器学习、MADlib、技术解析方面的内容,本书是由清华大学出版社出版,格式根据源资源分为PDF、epub、mobi、azw3其中一种或多种格式,资源大小38.5 MB,王雪迎编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.8,更多相关的学习资源可以参阅 人工智能电子书、等栏目。

SQL机器学习库MADlib技术解析 PDF

做为一名数据库查询开发者或DBA,当应对聚类分析或主成分分析等难题时将会会一筹莫展。原因很简单,用經典SQL言语保持这种繁杂模型基础是不太可能的。如今,DBA运用MADlib,只需应用SQL查寻就能保持简易的机器学习,这也更是撰写这书的初心。MADlib与别的机器学习专用工具具备彻底不一样的设计构思。它并不是朝向程序猿的,只是朝向数据库查询开发者或DBA的,是根据SQL的互联网大数据机器学习库。MADlib将SQL的简易可维护性与机器学习的繁杂算法紧密结合,灵活运用了二者的优点和特性。针对众多传统式数据库查询运用专业技术人员而言,学习培训和从业机器学习工作中的门坎将大幅度降低。对客户来讲,MADlib提供了可在SQL查寻句子中启用的函数,不但包含基础的线性代数与运算和统计函数,还提供了常见的、制好的设备学习模型函数,保持了归类、聚类算法、关系、重归、预测分析、评定等运用中的常用算法。客户不用深层次掌握算法的程序实现关键点,要是弄清楚各函数中有关主要参数的含意、提供恰当的入参并可以了解和表述函数的輸出結果就能。MADlib是一套SQL中的互联网大数据机器学习库。一般SQL查寻能发觉统计数据*显著的方式和发展趋势,但是想读取数据中*为有效的信息内容,必须的则是一套坚固投身于数学课和应用数学的专业技能,这就是说机器学习。假如将SQL的简易实用与MADlib机器学习的繁杂算法结合在一起,就能保持简易的机器学习作用。 这书分成11章,从MADlib的基本要素、MADlib的构架、兼容的模型种类与作用下手,详尽分析MADlib各种各样模型的实际使用方法,包含数据类型、矩阵分解、数据转换、统计数据探寻、主成分分析、重归、时间序列分析、归类、聚类算法、关联规则、图算法、模型评定等。每个模型将从背景图专业知识、函数英语的语法、运用范例三层面开展 表明。 这书合适MADlib机器学习的新手、想学习培训MADlib机器学习的DBA及其从业数据统计分析与发掘的高級专业技术人员阅读文章,也合适高等学校与培训机构有关技术专业的老师学生课堂教学参照

目录

  • 第1章  MADlib基础    1
  • 1.1  基本概念    1
  • 1.1.1  MADlib是什么    1
  • 1.1.2  MADlib的设计思想    2
  • 1.1.3  MADlib的工作原理    3
  • 1.1.4  MADlib的执行流程    4
  • 1.1.5  MADlib架构    5
  • 1.2  MADlib的功能    6
  • 1.2.1  MADlib支持的模型类型    6
  • 1.2.2  MADlib的主要功能模块    7
  • 1.3  MADlib的安装与卸载    9
  • 1.3.1  确定安装平台    9
  • 1.3.2  下载MADlib二进制压缩包    10
  • 1.3.3  安装MADlib    10
  • 1.3.4  卸载MADlib    12
  • 1.4  小结    13
  • 第2章  数据类型    14
  • 2.1  向量    14
  • 2.1.1  MADlib中的向量操作函数    15
  • 2.1.2  稀疏向量    23
  • 2.2  矩阵    30
  • 2.2.1  矩阵定义    31
  • 2.2.2  MADlib中的矩阵表示    31
  • 2.2.3  MADlib中的矩阵运算函数    32
  • 2.3  小结    49
  • 第3章  数据转换    50
  • 3.1  邻近度    50
  • 3.1.1  MADlib的邻近度相关函数    50
  • 3.1.2  距离度量的中心化和标准化    57
  • 3.1.3  选取正确的邻近度度量    58
  • 3.2  矩阵分解    59
  • 3.2.1  低秩矩阵分解    59
  • 3.2.2  奇异值分解    70
  • 3.3  透视表    87
  • 3.4  分类变量编码    97
  • 3.5  小结    110
  • 第4章  数据探索    111
  • 4.1  描述性统计    111
  • 4.1.1  皮尔森相关    111
  • 4.1.2  汇总统计    117
  • 4.2  概率统计    125
  • 4.2.1  概率    125
  • 4.2.2  统计推论    133
  • 4.3  主成分分析    147
  • 4.3.1  背景知识    147
  • 4.3.2  MADlib的PCA相关函数    149
  • 4.3.3  MADlib的PCA应用示例    155
  • 4.4  小结    160
  • 第5章  回归    161
  • 5.1  线性回归    161
  • 5.1.1  背景知识    161
  • 5.1.2  MADlib的线性回归相关函数    164
  • 5.1.3  线性回归示例    166
  • 5.2  非线性回归    171
  • 5.2.1  背景知识    171
  • 5.2.2  MADlib的非线性回归相关
  •       函数    172
  • 5.2.3  非线性回归示例    175
  • 5.3  逻辑回归    179
  • 5.3.1  背景知识    179
  • 5.3.2  MADlib的逻辑回归相关函数    180
  • 5.3.3  逻辑回归示例    182
  • 5.4  多类回归    187
  • 5.4.1  背景知识    187
  • 5.4.2  MADlib的多类回归相关函数    190
  • 5.4.3  多类回归示例    192
  • 5.5  序数回归    196
  • 5.5.1  背景知识    196
  • 5.5.2  MADlib的序数回归相关函数    197
  • 5.5.3  序数回归示例    200
  • 5.6  弹性网络回归    202
  • 5.6.1  背景知识    202
  • 5.6.2  MADlib的弹性网络回归相关
  •       函数    204
  • 5.6.3  弹性网络回归示例    209
  • 5.7  小结    221
  • 第6章  时间序列分析    222
  • 6.1  背景知识    222
  • 6.1.1  时间序列分析方法    222
  • 6.1.2  ARIMA模型    223
  • 6.2  MADlib中ARIMA相关函数    225
  • 6.3  时间序列分析示例    228
  • 6.4  小结    232
  • 第7章  分类    233
  • 7.1  K近邻    233
  • 7.1.1  背景知识    233
  • 7.1.2  MADlib中K近邻函数    235
  • 7.1.3  K近邻示例    236
  • 7.2  朴素贝叶斯    240
  • 7.2.1  背景知识    240
  • 7.2.2  MADlib中朴素贝叶斯分类
  •       相关函数    242
  • 7.2.3  朴素贝叶斯分类示例    244
  • 7.3  支持向量机    249
  • 7.3.1  背景知识    249
  • 7.3.2  MADlib的支持向量机相关
  •       函数    252
  • 7.3.3  支持向量机示例    258
  • 7.4  决策树    264
  • 7.4.1  背景知识    264
  • 7.4.2  MADlib的决策树相关函数    267
  • 7.4.3  决策树示例    272
  • 7.5  随机森林    281
  • 7.5.1  背景知识    281
  • 7.5.2  MADlib的随机森林相关函数    282
  • 7.5.3  随机森林示例    287
  • 7.6  小结    293
  • 第8章  聚类    294
  • 8.1  背景知识    294
  • 8.1.1  聚类的概念    294
  • 8.1.2  k-means方法    295
  • 8.2  MADlib的k-means相关函数    297
  • 8.2.1  训练函数    298
  • 8.2.2  簇分配函数    300
  • 8.2.3  轮廓系数函数    301
  • 8.3  k-means示例    301
  • 8.4  小结    307
  • 第9章  关联规则    308
  • 9.1  背景知识    308
  • 9.1.1  基本概念    308
  • 9.1.2  Apriori算法    311
  • 9.2  MADlib的Apriori算法函数    312
  • 9.3  Apriori应用示例    313
  • 9.4  小结    319
  • 第10章  图算法    320
  • 10.1  背景知识    320
  • 10.1.1  基本概念    320
  • 10.1.2  常见图算法    321
  • 10.1.3  单源最短路径    323
  • 10.2  MADlib的单源最短路径相关函数    324
  • 10.3  单源最短路径示例    325
  • 10.4  小结    327
  • 第11章  模型评估    328
  • 11.1  交叉验证    328
  • 11.1.1  背景知识    328
  • 11.1.2  MADlib的交叉验证相关
  • 函数    331
  • 11.1.3  交叉验证示例    333
  • 11.2  预测度量    336
  • 11.3  小结    342

上一篇:Odoo快速入门与实战:Python开发ERP指南  下一篇:演说之法:PPT高手思维秘籍

展开 +

收起 -

MADlib 相关电子书
MADlib 学习笔记
网友NO.373559

Python机器学习logistic回归代码解析

本文主要研究的是Python机器学习logistic回归的相关内容,同时介绍了一些机器学习中的概念,具体如下。 Logistic回归的主要目的 :寻找一个非线性函数sigmod最佳的拟合参数 拟合、插值和逼近是数值分析的三大工具 回归: 对一直公式的位置参数进行估计 拟合 :把平面上的一些系列点,用一条光滑曲线连接起来 logistic主要思想: 根据现有数据对分类边界线建立回归公式、以此进行分类 sigmoid函数: 在神经网络中它是所谓的激励函数。当输入大于0时,输出趋向于1,输入小于0时,输出趋向0,输入为0时,输出为0.5 梯度上升 :要找到某个函数的最大值,最好的方法是沿着该函数的梯度方向探寻 收敛: 随着迭代的运行算法的结果和真实结果的误差越来越小,且趋向于一个固定值。 爬山算法: 是完完全全的贪心算法,每次鼠目寸光的选择一个当前最优解,英雌只能搜寻到局部最优值 模拟退火算法: 也是一种贪心算法但它的sou索过程引入了随机因素,模拟退火算法以一定的概念来接受一个比当前解要差的解,因此有可能会跳出这个局部最优解,达到全局最优解。 处理数据中的缺失值: 使用可用特征的均值来填补缺失值 使用特殊值来填补缺失值,如-1 忽略有缺失值的样本 使用相似样本的均值添补缺失值 使用其它机器学习算法……

网友NO.120077

机器学习python实战之手写数字识别

看了上一篇内容之后,相信对K近邻算法有了一个清晰的认识,今天的内容——手写数字识别是对上一篇内容的延续,这里也是为了自己能更熟练的掌握k-NN算法。 我们有大约2000个训练样本和1000个左右测试样本,训练样本所在的文件夹是trainingDigits,测试样本所在的文件夹是testDigits。文本文件中是0~9的数字,但是是用二值图表示出来的,如图。我们要做的就是使用训练样本训练模型,并用测试样本来检测模型的性能。 首先,我们需要将文本文件中的内容转化为向量,因为图片大小是32*32,所以我们可以将其转化为1*1024的向量。具体代码实现如下: def img2vector(filename): imgVec = zeros((1,1024)) file = open(filename) for i in range(32): lines = file.readline() for j in range(32): imgVec[0,32*i+j] = lines[j] return imgVec 实现了图片到向量的转化之后,我们就可以对测试文件中的内容进行识别了。这里的识别我们可以使用上一篇中的自定义函数classify0,这个函数的第一个参数是测试向量,第二个参数是训练数据集,第三个参数是训练集的标签。所以,我们首先需要将训练数据集转化为(1934*1024)的矩阵,1934这里是训练集的组数即trainingDigits目录下的文件数,其对应的标签转化为(1*1934)的向量。之后要编写的代码就是对测试数据集中的每个文本文件进行识别,也……

网友NO.785601

python机器学习实战之树回归详解

本文实例为大家分享了树回归的具体代码,供大家参考,具体内容如下 #-*- coding:utf-8 -*- #!/usr/bin/python ''''' 回归树 连续值回归预测 的 回归树 ''' # 测试代码 # import regTrees as RT RT.RtTreeTest() RT.RtTreeTest('ex0.txt') RT.RtTreeTest('ex2.txt') # import regTrees as RT RT.RtTreeTest('ex2.txt',ops=(10000,4)) # import regTrees as RT RT.pruneTest() # 模型树 测试 # import regTrees as RT RT.modeTreeTest(ops=(1,10) # 模型回归树和普通回归树 效果比较 计算相关系数 # import regTrees as RT RT.MRTvsSRT() from numpy import * # Tab 键值分隔的数据 提取成 列表数据集 成浮点型数据 def loadDataSet(fileName): # dataMat = [] # 目标数据集 列表 fr = open(fileName) for line in fr.readlines(): curLine = line.strip().split('\t') fltLine = map(float,curLine) #转换成浮点型数据 dataMat.append(fltLine) return dataMat # 按特征值 的数据集二元切分 特征(列) 对应的值 # 某一列的值大于value值的一行样本全部放在一个矩阵里,其余放在另一个矩阵里 def binSplitDataSet(dataSet, feature, value): mat0 = dataSet[nonzero(dataSet[:,feature] value)[0],:][0] # 数组过滤 mat1 = dataSet[nonzero(dataSet[:,feature] = value)[0],:][0] # return mat0,mat1 # 常量叶子节点 def regLeaf(dataSet):# 最后一列为标签 为数的叶子节点 return mean(dataSet[:,-1])# 目标变量的均值 # 方差 def regErr(dataSet): return var(dataSet[:,-1]) * shape(dataSet)[0]# 目标变……

网友NO.668075

Python机器学习之scikit-learn库中KNN算法的封装与使用方法

本文实例讲述了Python机器学习之scikit-learn库中KNN算法的封装与使用方法。分享给大家供大家参考,具体如下: 1、工具准备,python环境,pycharm 2、在机器学习中,KNN是不需要训练过程的算法,也就是说,输入样例可以直接调用predict预测结果,训练数据集就是模型。当然这里必须将训练数据和训练标签进行拟合才能形成模型。 3、在pycharm中创建新的项目工程,并在项目下新建KNN.py文件。 import numpy as npfrom math import sqrtfrom collections import Counterclass KNNClassifier: def __init__(self,k): """初始化KNN分类器""" assert k = 1 """断言判断k的值是否合法""" self.k = k self._X_train = None self._y_train = None def fit(self,X_train,y_train): """根据训练数据集X_train和Y_train训练KNN分类器,形成模型""" assert X_train.shape[0] == y_train.shape[0] """数据和标签的大小必须一样 assert self.k = X_train.shape[0] """k的值不能超过数据的大小""" self._X_train = X_train self._y_train = y_train return self def predict(self,X_predict): """必须将训练数据集和标签拟合为模型才能进行预测的过程""" assert self._X_train is not None and self._y_train is not None """训练数据和标签不可以是空的""" assert X_predict.shape[1]== self._X_train.shape[1] """待预测数据和训练数据的列(特征个数)必须相同""" y_predict = [self._predict(x) for x in X_predict] return np.array(y_predict) ……

码小辫

码小辫 发起

资源
44
粉丝
13
喜欢
173
评论
18

    Copyright 2018-2019 xz577.com 码农之家

    版权责任说明