SQL机器学习库MADlib技术解析

更新：2019-10-25
大小：38.5 MB
类别：MADlib
作者：王雪迎
出版：清华大学出版社
版本：PDF 完整原版

资源介绍
相关推荐

SQL机器学习库MADlib技术解析 PDF

做为一名数据库查询开发者或DBA，当应对聚类分析或主成分分析等难题时将会会一筹莫展。原因很简单，用經典SQL言语保持这种繁杂模型基础是不太可能的。如今，DBA运用MADlib，只需应用SQL查寻就能保持简易的机器学习，这也更是撰写这书的初心。MADlib与别的机器学习专用工具具备彻底不一样的设计构思。它并不是朝向程序猿的，只是朝向数据库查询开发者或DBA的，是根据SQL的互联网大数据机器学习库。MADlib将SQL的简易可维护性与机器学习的繁杂算法紧密结合，灵活运用了二者的优点和特性。针对众多传统式数据库查询运用专业技术人员而言，学习培训和从业机器学习工作中的门坎将大幅度降低。对客户来讲，MADlib提供了可在SQL查寻句子中启用的函数，不但包含基础的线性代数与运算和统计函数，还提供了常见的、制好的设备学习模型函数，保持了归类、聚类算法、关系、重归、预测分析、评定等运用中的常用算法。客户不用深层次掌握算法的程序实现关键点，要是弄清楚各函数中有关主要参数的含意、提供恰当的入参并可以了解和表述函数的輸出結果就能。MADlib是一套SQL中的互联网大数据机器学习库。一般SQL查寻能发觉统计数据*显著的方式和发展趋势，但是想读取数据中*为有效的信息内容，必须的则是一套坚固投身于数学课和应用数学的专业技能，这就是说机器学习。假如将SQL的简易实用与MADlib机器学习的繁杂算法结合在一起，就能保持简易的机器学习作用。这书分成11章，从MADlib的基本要素、MADlib的构架、兼容的模型种类与作用下手，详尽分析MADlib各种各样模型的实际使用方法，包含数据类型、矩阵分解、数据转换、统计数据探寻、主成分分析、重归、时间序列分析、归类、聚类算法、关联规则、图算法、模型评定等。每个模型将从背景图专业知识、函数英语的语法、运用范例三层面开展表明。这书合适MADlib机器学习的新手、想学习培训MADlib机器学习的DBA及其从业数据统计分析与发掘的高級专业技术人员阅读文章，也合适高等学校与培训机构有关技术专业的老师学生课堂教学参照