当前位置:首页 > 其它 >
《Mahout算法解析与案例实战》电子书封面

Mahout算法解析与案例实战

  • 发布时间:2020年09月20日 10:56:20
  • 作者:樊哲
  • 大小:61 MB
  • 类别:Mahout电子书
  • 格式:PDF
  • 版本:高清版
  • 评分:7.1

    Mahout算法解析与案例实战 PDF 高清版

      给大家带来的一篇关于Mahout相关的电子书资源,介绍了关于Mahout、算法解析、案例实战方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小61 MB,樊哲编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.9。

      内容介绍

      Mahout算法解析与案例实战是一本经典的Mahout著作,原理与实战并重。不仅全面分析了Mahout算法库不同模块中的各个算法的原理及其实现流程,而且每个算法都辅之以实战案例。此外,还包括4个系统级案例,实战性非常强。

      全书11章共分为三个部分:第一部分为基础篇(第1~2章),首先介绍了Mahout的应用背景、Mahout算法库收录的算法、Mahout的应用实例,以及开发环境的搭建;第二部分为算法篇(第3~7章),分析了Mahout算法库中不同模块的各个算法的原理以及Mahout实现流程,同时在各章节含有每个算法的实战,让读者可以自己运行程序,感受程序运行的各个流程;第三部分为实战篇(第8~11章),通过对4个不同系统案例的分析讲解,让读者了解开发完整的云平台系统的各个流程,即需求分析、系统框架选择及构建、系统功能设计和功能开发。

      目录

      • 第一部分 基础篇
      • 第1章 Mahout简介 2
      • 1.1 Mahout应用背景 2
      • 1.2 Mahout算法库 3
      • 1.2.1 聚类算法 4
      • 1.2.2 分类算法 5
      • 1.2.3 协同过滤算法 6
      • 1.2.4 频繁项集挖掘算法 7
      • 1.3 Mahout应用 7
      • 1.4 本章小结 8
      • 第2章 Mahout安装配置 9
      • 2.1 Mahout安装前的准备 9
      • 2.1.1 安装JDK 10
      • 2.1.2 安装Hadoop 12
      • 2.2 两种安装方式 20
      • 2.2.1 使用Maven安装 20
      • 2.2.2 下载发布版安装 22
      • 2.3 测试安装 22
      • 2.4 本章小结 24
      • 第二部分 算法篇
      • 第3章 聚类算法 26
      • 3.1 Canopy算法 26
      • 3.1.1 Canopy算法简介 26
      • 3.1.2 Mahout中Canopy算法实现原理 28
      • 3.1.3 Mahout的Canopy算法实战 29
      • 3.1.4 Canopy算法小结 37
      • 3.2 K-Means算法 37
      • 3.2.1 K-Means算法简介 37
      • 3.2.2 Mahout中K-Means算法实现原理 38
      • 3.2.3 Mahout的K-Means算法实战 39
      • 3.2.4 K-Means算法小结 46
      • 3.3 Mean Shift算法 46
      • 3.3.1 Mean Shift算法简介 46
      • 3.3.2 Mahout中Mean Shift算法实现原理 46
      • 3.3.3 Mahout的Mean Shift算法实战 48
      • 3.3.4 Mean Shift算法小结 51
      • 3.4 本章小结 51
      • 第4章 分类算法 52
      • 4.1  Bayesian算法 53
      • 4.1.1 Bayesian算法简介 53
      • 4.1.2 Mahout 中Bayesian算法实现原理 55
      • 4.1.3 Mahout的Bayesian算法实战 59
      • 4.1.4 拓展 70
      • 4.1.5 Bayesian算法小结 70
      • 4.2 Random Forests算法 70
      • 4.2.1 Random Forests算法简介 70
      • 4.2.2 Mahout中Random Forests算法实现原理 72
      • 4.2.3 Mahout的Random Forests算法实战 77
      • 4.2.4 拓展 81
      • 4.2.5 Random Forests算法小结 82
      • 4.3 本章小结 83
      • 第5章 协同过滤算法 84
      • 5.1 Distributed Item-Based Collaborative Filtering算法 85
      • 5.1.1 Distributed Item-Based Collaborative Filtering算法简介 85
      • 5.1.2 Mahout中Distributed ItemBased Collaborative Filtering算法实现原理 86
      • 5.1.3 Mahout的Distributed Item Based Collaborative Filtering算法实战 90
      • 5.1.4 拓展 93
      • 5.1.5 Distributed ItemBased Collabo-rative Filtering算法小结 94
      • 5.2 Collaborative Filtering with ALSWR算法 94
      • 5.2.1 Collaborative Filtering with ALSWR算法简介 94
      • 5.2.2 Mahout中Collaborative Filtering with ALS-WR算法实现原理 98
      • 5.2.3 Mahout的Collaborative Filtering with ALS-WR算法实战 99
      • 5.2.4 拓展 107
      • 5.2.5 Collaborative Filtering with ALSWR算法小结 107
      • 5.3 本章小结 107
      • 第6章 模式挖掘算法 108
      • 6.1 FP树关联规则算法 109
      • 6.1.1 FP树关联规则算法简介 109
      • 6.1.2 Mahout中Parallel Frequent Pattern Mining算法实现原理 113
      • 6.1.3 Mahout的Parallel Frequent Pattern Mining算法实战 120
      • 6.1.4 拓展 125
      • 6.2 本章小结 126
      • 第7章 Mahout中的其他算法 127
      • 7.1 Dimension Reduction算法 128
      • 7.1.1 Dimension Reduction算法简介 128
      • 7.1.2 Mahout中Dimension Reduction算法实现原理 129
      • 7.1.3 Mahout的Dimension Reduction算法实战 133
      • 7.1.4 拓展 139
      • 7.2 本章小结 142
      • 第三部分 实战篇
      • 第8章 Friend Find系统 144
      • 8.1 系统功能 145
      • 8.1.1 系统管理员 145
      • 8.1.2 普通用户 146
      • 8.1.3 总体功能 146
      • 8.2 数据库设计 147
      • 8.2.1 原始用户数据表 148
      • 8.2.2 注册用户数据表 149
      • 8.2.3 系统管理员表 149
      • 8.2.4 聚类中心表 149
      • 8.3 系统技术框架 150
      • 8.4 系统流程 152
      • 8.4.1 登录 152
      • 8.4.2 注册 153
      • 8.4.3 上传数据 154
      • 8.4.4 调用K-Means算法 155
      • 8.4.5 查看用户分组 157
      • 8.4.6 查看分组情况 158
      • 8.4.7 查看分组成员 159
      • 8.5 系统实现 159
      • 8.5.1 登录 159
      • 8.5.2 注册 161
      • 8.5.3 上传数据 162
      • 8.5.4 调用K-Means算法 163
      • 8.5.5 查看用户分组 167
      • 8.5.6 查看分组情况 167
      • 8.5.7 查看分组成员 168
      • 8.6 本章小结 170
      • 第9章 Wine Identification系统 171
      • 9.1 系统功能 172
      • 9.1.1 用户管理模块 173
      • 9.1.2 随机森林模型建立模块 173
      • 9.1.3 随机森林模型预测模块 173
      • 9.2 系统框架 173
      • 9.3 数据库设计 180
      • 9.3.1 用户表 180
      • 9.3.2 系统常量表 181
      • 9.4 系统流程 181
      • 9.4.1 登录 182
      • 9.4.2 注销 182
      • 9.4.3 权限修改 182
      • 9.4.4 密码修改 183
      • 9.4.5 用户列表 183
      • 9.4.6 数据上传 184
      • 9.4.7 随机森林模型建立 185
      • 9.4.8 随机森林模型评估 186
      • 9.4.9 随机森林模型预测 187
      • 9.5 系统实现 188
      • 9.5.1 登录 188
      • 9.5.2 注销 188
      • 9.5.3 权限修改 189
      • 9.5.4 密码修改 190
      • 9.5.5 用户列表 191
      • 9.5.6 数据上传 193
      • 9.5.7 随机森林模型建立 194
      • 9.5.8 随机森林模型评估 194
      • 9.5.9 随机森林模型预测 195
      • 9.6 本章小结 196
      • 第10章 Dating Recommender系统 197
      • 10.1 系统功能 198
      • 10.1.1 系统管理员功能 198
      • 10.1.2 普通用户功能 199
      • 10.1.3 功能总述 199
      • 10.2 系统框架 200
      • 10.3 数据库设计 203
      • 10.3.1 系统管理员表 203
      • 10.3.2 原始用户推荐信息表 204
      • 10.3.3 基础数据top10表 204
      • 10.4 系统流程 204
      • 10.4.1 登录 205
      • 10.4.2 上传数据 205
      • 10.4.3 推荐分析 206
      • 10.4.4 单用户推荐 210
      • 10.4.5 新用户推荐 211
      • 10.5 算法设计 214
      • 10.5.1 协同过滤算法接口设计 214
      • 10.5.2 top10算法设计 215
      • 10.5.3 新用户推荐算法设计 221
      • 10.6 系统实现 228
      • 10.6.1 登录 228
      • 10.6.2 上传数据 229
      • 10.6.3 推荐分析 230
      • 10.6.4 单用户推荐 232
      • 10.6.5 新用户推荐 234
      • 10.7 本章小结 235
      • 第11章 博客推荐系统 237
      • 11.1 系统功能 238
      • 11.1.1 用户管理 238
      • 11.1.2 建立知识库 239
      • 11.1.3 博客管理 239
      • 11.2 系统框架 240
      • 11.3 数据库设计 246
      • 11.3.1 用户信息表 246
      • 11.3.2 知识库信息表 247
      • 11.3.3 系统常量表 248
      • 11.4 系统流程 248
      • 11.4.1 登录 248
      • 11.4.2 注册 248
      • 11.4.3 密码修改 249
      • 11.4.4 订阅博客查看 249
      • 11.4.5 博客订阅与退订 249
      • 11.4.6 博客推荐 250
      • 11.4.7 上传数据 252
      • 11.4.8 调用FP树关联规则算法 253
      • 11.5 算法设计 260
      • 11.6 系统实现 262
      • 11.6.1 登录 262
      • 11.6.2 注册 263
      • 11.6.3 密码修改 264
      • 11.6.4 订阅博客查看 265
      • 11.6.5 运行FP云算法 266
      • 11.6.6 博客订阅与退订 267
      • 11.6.7 博客推荐 268
      • 11.7 本章小结 270

      学习笔记

      TF-IDF算法解析与Python实现方法详解

      TF-IDF(term frequency–inverse document frequency)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。比较容易理解的一个应用场景是当我们手头有一些文章时,我们希望计算机能够自动地进行关键词提取。而TF-IDF就是可以帮我们完成这项任务的一种统计方法。它能够用于评估一个词语对于一个文集或一个语料库中的其中一份文档的重要程度。 在一份给定的文件里,词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被归一化(分子一般小于分母 区别于IDF),以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不……

      python实现排序算法解析

      本文实例为大家分享了python实现排序算法的具体代码,供大家参考,具体内容如下 一、冒泡排序 def bububle_sort(alist): """冒泡排序(稳定|n^2m)""" n = len(alist) for j in range(n-1): count = 0 for i in range(0,n-1-j): if alist[i]alist[i+1]: count +=1 alist[i], alist[i+1] = alist[i+1], alist[i] if count==0: return 二、选择排序 def select_sort(alist): """选择排序(不稳定|n^2)""" n = len(alist) for j in range(n-1): min_index = j for i in range(j+1,n): if alist[min_index] alist[i]: min_index = i alist[j], alist[min_index] = alist[min_index], alist[j] 三、插入排序 def insert_sort(alist): """插入排序(稳定|n^2)""" n = len(alist) for j in range(1,n): i = j while i0: if alist[i] alist[i-1]: alist[i], alist[i-1] = alist[i-1], alist[i] i -……

      以上就是本次介绍的Mahout电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:数据库系统:数据库与数据仓库导论

      下一篇:系统架构设计师教程

      展开 +

      收起 -

      下载地址:百度网盘下载
      Mahout相关电子书
      深度学习之图像识别:核心技术与案例实战
      深度学习之图像识别:核心技术与案例实战 立即下载
      Arduino案例实战:卷Ⅰ
      Arduino案例实战:卷Ⅰ 扫描版

      这书以全民创业大众创业为时代特征,以物联网技术和智能开源硬件发展为技术背景,总结信息化时代自主创新模式、创新思维方法和产品创新。以CDIO(ConceiveDesignImplementoperate)方法为

      立即下载
      图解Spark:核心技术与案例实战
      图解Spark:核心技术与案例实战 高清版

      图解Spark:核心技术与案例实战 以Spark 2.0 版本为基础进行编写,全面介绍了Spark 核心及其生态圈组件技术。主要内容包括Spark 生态圈、实战环境搭建、编程模型和内部重要模块的分析,重点介

      立即下载
      iOS动画:核心技术与案例实战
      iOS动画:核心技术与案例实战 高清扫描版

      目前,APP Store上的应用已经超过150万个,而纵观排名较为靠前的应用,无一例外都有着一个共同的特点,那就是良好的用户体验。动画作为用户体验中复杂、绚丽的技术已经备受开发人员和产

      立即下载
      Arduino案例实战:卷Ⅱ
      Arduino案例实战:卷Ⅱ 影印版

      《Arduino案例实战:卷Ⅱ》是一本关于Arduino的电子书资源,涉及Arduino、案例、实战等相关内容,本文提供大小为73.6MB的影印PDF格式电子书下载,希望大家能够喜欢。

      立即下载
      读者留言
      朱弘文

      朱弘文 提供上传

      资源
      21
      粉丝
      9
      喜欢
      144
      评论
      20

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com