给大家带来的一篇关于Mahout相关的电子书资源,介绍了关于Mahout、算法解析、案例实战方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小61 MB,樊哲编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.7分
Mahout算法解析与案例实战是一本经典的Mahout著作,原理与实战并重。不仅全面分析了Mahout算法库不同模块中的各个算法的原理及其实现流程,而且每个算法都辅之以实战案例。此外,还包括4个系统级案例,实战性非常强。
全书11章共分为三个部分:第一部分为基础篇(第1~2章),首先介绍了Mahout的应用背景、Mahout算法库收录的算法、Mahout的应用实例,以及开发环境的搭建;第二部分为算法篇(第3~7章),分析了Mahout算法库中不同模块的各个算法的原理以及Mahout实现流程,同时在各章节含有每个算法的实战,让读者可以自己运行程序,感受程序运行的各个流程;第三部分为实战篇(第8~11章),通过对4个不同系统案例的分析讲解,让读者了解开发完整的云平台系统的各个流程,即需求分析、系统框架选择及构建、系统功能设计和功能开发。
以上就是本次介绍的Mahout电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。
上一篇:数据库系统:数据库与数据仓库导论
下一篇:海量运维、运营规划之道
展开 +
收起 -
本文实例为大家分享了python实现排序算法的具体代码,供大家参考,具体内容如下 一、冒泡排序 def bububle_sort(alist): """冒泡排序(稳定|n^2m)""" n = len(alist) for j in range(n-1): count = 0 for i in range(0,n-1-j): if alist[i]alist[i+1]: count +=1 alist[i], alist[i+1] = alist[i+1], alist[i] if count==0: return 二、选择排序 def select_sort(alist): """选择排序(不稳定|n^2)""" n = len(alist) for j in range(n-1): min_index = j for i in range(j+1,n): if alist[min_index] alist[i]: min_index = i alist[j], alist[min_index] = alist[min_index], alist[j] 三、插入排序 def insert_sort(alist): """插入排序(稳定|n^2)""" n = len(alist) for j in range(1,n): i = j while i0: if alist[i] alist[i-1]: alist[i], alist[i-1] = alist[i-1], alist[i] i -……
Copyright 2018-2021 www.xz577.com 码农之家
版权投诉 / 书籍推广 / 赞助:520161757@qq.com
TF-IDF算法解析与Python实现方法详解
TF-IDF(term frequency–inverse document frequency)是一种用于信息检索(information retrieval)与文本挖掘(text mining)的常用加权技术。比较容易理解的一个应用场景是当我们手头有一些文章时,我们希望计算机能够自动地进行关键词提取。而TF-IDF就是可以帮我们完成这项任务的一种统计方法。它能够用于评估一个词语对于一个文集或一个语料库中的其中一份文档的重要程度。 在一份给定的文件里,词频 (term frequency, TF) 指的是某一个给定的词语在该文件中出现的次数。这个数字通常会被归一化(分子一般小于分母 区别于IDF),以防止它偏向长的文件。(同一个词语在长文件里可能会比短文件有更高的词频,而不……