当前位置:首页 > >
《实用机器学习》电子书封面

实用机器学习

  • 发布时间:2019年04月19日 10:04:33
  • 作者:孙亮 黄倩
  • 大小:63.8 MB
  • 类别:机器学习算法电子书
  • 格式:PDF
  • 版本:高质量版
  • 评分:9.7

    机器学习算法推荐

    实用机器学习 PDF 高质量版

      给大家带来的一篇关于机器学习算法相关的电子书资源,介绍了关于机器学习方面的内容,本书是由人民邮电出版社出版,格式为PDF,资源大小63.8 MB,孙亮 黄倩编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.7分

      Tags:

      内容介绍

      读者评价

      很快读完异步社区的样章后火速下单。行文流畅,架构内容都很好。讲了机器学习常用四大类算法的基本原理、适用场景、评价标准还有相应的R程序实践。很务实,实际操作性强。可能太务实了,没有和时下一些大热的关键词,没有讲最流行的语言和工具,因此关注度不高

      本书适合Python 程序员、数据分析人员、对算法感兴趣的读者、机器学习领域的从业人员及科研人员阅读。

      一本用Python实现机器学习的项目集。里面细致地记录了用Python的各种库实现这些小项目的过程。在有了机器学习基础和熟悉常见的数据处理Python库后,看一下还行。

      这本书不厚,但却覆盖了用机器学习技术解决实际问题的主要步骤和常用算法。考虑到实践中大家更关注的是如何选择和使用算法,两位作者还使用R语言软件包来引导读者实际操作。与市面上对机器学习作一般性介绍的书籍相比,本书介绍的算法稍稍复杂一些,但也更加实用,书中讨论的内容正是实际应用机器学习解决问题时所需要掌握的内容。对于广大业界爱好者和相关专业研究生来说,这是一本理想的入门读物和参考书,因此我非常乐意向大家推荐本书。 ——叶杰平 滴滴研究院副院长、密歇根大学终身教授

      这是一本非常贴近实际应用的机器学习著作。两位作者根据多年的一线科研和工程实践经验,选取了zui典型的一些机器学习算法,既通俗易懂地介绍了原理,又给出了公开数据集上的R语言实践。行文风格方面,本书兼顾了高校师生和工程技术人员的实际需求,在理论与实践之间达成了一个较好的平衡,因此具有广泛的适用性,值得推荐。 ——陈震中 国家青年千人计划专家、武汉大学教授

      现有的机器学习书籍有些侧重于算法原理的讲解,对具体实现介绍得很少;有些侧重于基本概念和算法的实现,易于上手但难于把握算法原理的精妙细节之处。本书淡化了对数学背景知识的要求,突出了对常用算法的通俗讲解和基于R软件包的实现,便于读者快速上手,是一本不可多得的机器学习教材和自学参考书,“实用”二字实至名归。 ——闫胜业 南京信息工程大学教授

      本书从解决实际问题的角度介绍了五类常用的机器学习模型,包括回归模型、分类模型、推荐模型、排序模型和集成学习模型。作者不仅介绍了模型的基本原理,还介绍了特征工程、模型评价和选择等相关的知识。内容有深度但通俗易懂,有广度但不一味求全,具有很强的实用性。本书既适合机器学习初学者,也可以作为企业机器学习项目研发的参考书。 ——李武军 南京大学副教授、博士生导师

      越来越多的岗位要求机器学习方面的专业知识。每年都有一些机器学习专业的应届毕业生加入我们的团队,但是我们发现很多人在如何应用机器学习解决实际问题方面还存在知识缺失的问题。这本书从要解决的问题类型出发,介绍了机器学习的各种基本概念以及那些zui实用的算法,并全面阐述了使用机器学习解决问题的全过程,娓娓道来而又深入浅出,对于初学者来说是一本很好的入门读物,对于广大的机器学习从业者来说也是一本很好的参考书。尽管本人从事机器学习的研究和应用多年,但是阅读此书也感到受益匪浅。 ——唐磊 Clari首席数据科学家

      很高兴孙亮博士和黄倩博士将他们在工业界多年应用机器学习积累的相关经验和成果整理出来,值得向大家强烈推荐这本书。在我们的工作实践中,所遇到的大部分问题不外乎回归、分类、推荐、排序诸类,而集成学习是我们在建模过程中使用zui多的一类算法。本书系统地讲解了适用于这些问题的常用算法,并且介绍了R中相应的软件包。就实用性而言,是一本非常贴近实战的不可多得的好书。 ——戚晓光 微软高级数据科学

      内容介绍

      大数据时代为机器学习的应用提供了广阔的空间,各行各业涉及数据分析的工作都需要使用机器学习算法。本书围绕实际数据分析的流程展开,着重介绍数据探索、数据预处理和常用的机器学习算法模型。本书从解决实际问题的角度出发,介绍回归算法、分类算法、推荐算法、排序算法和集成学习算法。在介绍每种机器学习算法模型时,书中不但阐述基本原理,而且讨论模型的评价与选择。为方便读者学习各种算法,本书介绍了R语言中相应的软件包并给出了示例程序。
      本书的一大特色就是贴近工程实践。首先,本书仅侧重介绍当前工业界常用的机器学习算法,而不追求知识内容的覆盖面;其次,本书在介绍每类机器学习算法时,力求通俗易懂地阐述算法思想,而不追求理论的深度,让读者借助代码获得直观的体验。

      内容节选

      机器学习10大经典算法详解

      1、C4.5

      C4.5算法是机器学习算法中的一种分类决策树算法,其核心算法是ID3算法.  C4.5算法继承了ID3算法的优点,并在以下几方面对ID3算法进行了改进:

           1)用信息增益率来选择属性,克服了用信息增益选择属性时偏向选择取值多的属性的不足;

          2)在树构造过程中进行剪枝;

          3)能够完成对连续属性的离散化处理;

          4)能够对不完整数据进行处理。

      C4.5算法有如下优点:产生的分类规则易于理解,准确率较高。其缺点是:在构造树的过程中,需要对数据集进行多次的顺序扫描和排序,因而导致算法的低效。 

      2、The k-means algorithm即K-Means算法

      k-means algorithm算法是一个聚类算法,把n的对象根据他们的属性分为k个分割,k < n。它与处理混合正态分布的最大期望算法很相似,因为他们都试图找到数据中自然聚类的中心。它假设对象属性来自于空间向量,并且目标是使各个群组内部的均方误差总和最小。 

      3、Support vector machines支持向量机

      支持向量机(Support Vector Machine),简称SV机(论文中一般简称SVM)。它是一种监督式学习的方法,它广泛的应用于统计分类以及回归分析中。支持向量机将向量映射到一个更高维的空间里,在这个空间里建立有一个最大间隔超平面。在分开数据的超平面的两边建有两个互相平行的超平面。分隔超平面使两个平行超平面的距离最大化。假定平行超平面间的距离或差距越大,分类器的总误差越小。一个极好的指南是C.J.C Burges的《模式识别支持向量机指南》。van der Walt和Barnard将支持向量机和其他分类器进行了比较。 

      4、The Apriori algorithm

      Apriori算法是一种最有影响的挖掘布尔关联规则频繁项集的算法。其核心是基于两阶段频集思想的递推算法。该关联规则在分类上属于单维、单层、布尔关联规则。在这里,所有支持度大于最小支持度的项集称为频繁项集,简称频集。 

      5、最大期望(EM)算法

      在统计计算中,最大期望(EM,Expectation–Maximization)算法是在概率(probabilistic)模型中寻找参数最大似然估计的算法,其中概率模型依赖于无法观测的隐藏变量(Latent Variabl)。最大期望经常用在机器学习和计算机视觉的数据集聚(Data Clustering)领域。 

      6、PageRank网页排名

      PageRank是Google算法的重要内容。2001年9月被授予美国专利,专利人是Google创始人之一拉里·佩奇(Larry Page)。因此,PageRank里的page不是指网页,而是指佩奇,即这个等级方法是以佩奇来命名的。

      PageRank根据网站的外部链接和内部链接的数量和质量俩衡量网站的价值。PageRank背后的概念是,每个到页面的链接都是对该页面的一次投票,被链接的越多,就意味着被其他网站投票越多。这个就是所谓的“链接流行度”——衡量多少人愿意将他们的网站和你的网站挂钩。PageRank这个概念引自学术中一篇论文的被引述的频度——即被别人引述的次数越多,一般判断这篇论文的权威性就越高。 

      7、AdaBoost

      Adaboost是一种迭代算法,其核心思想是针对同一个训练集训练不同的分类器(弱分类器),然后把这些弱分类器集合起来,构成一个更强的最终分类器(强分类器)。其算法本身是通过改变数据分布来实现的,它根据每次训练集之中每个样本的分类是否正确,以及上次的总体分类的准确率,来确定每个样本的权值。将修改过权值的新数据集送给下层分类器进行训练,最后将每次训练得到的分类器最后融合起来,作为最后的决策分类器。 

      8、kNN: k-nearest neighbor classification

      K最近邻(k-Nearest Neighbor,KNN)分类算法,是一个理论上比较成熟的方法,也是最简单的机器学习算法之一。该方法的思路是:如果一个样本在特征空间中的k个最相似(即特征空间中最邻近)的样本中的大多数属于某一个类别,则该样本也属于这个类别。 

      9、Naive Bayes朴素贝叶斯

      在众多的分类模型中,应用最为广泛的两种分类模型是决策树模型(Decision Tree Model)和朴素贝叶斯模型(Naive Bayesian Model,NBC)。朴素贝叶斯模型发源于古典数学理论,有着坚实的数学基础,以及稳定的分类效率。同时,NBC模型所需估计的参数很少,对缺失数据不太敏感,算法也比较简单。理论上,NBC模型与其他分类方法相比具有最小的误差率。但是实际上并非总是如此,这是因为NBC模型假设属性之间相互独立,这个假设在实际应用中往往是不成立的,这给NBC模型的正确分类带来了一定影响。在属性个数比较多或者属性之间相关性较大时,NBC模型的分类效率比不上决策树模型。而在属性相关性较小时,NBC模型的性能最为良好。 

      10、CART:分类与回归树

      CART, Classification and Regression Trees。在分类树下面有两个关键的思想。第一个是关于递归地划分自变量空间的想法;第二个想法是用验证数据进行剪枝。

      目录

      • 第1章  引论
      • 第2章  R语言
      • 第3章  数学基础
      • 第4章  数据探索和预处理
      • 第5章  回归分析
      • 第6章  分类算法
      • 第7章  推荐算法
      • 第8章  排序学习
      • 第9章  集成学习

      以上就是本次介绍的机器学习算法电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:微服务分布式构架开发实战

      下一篇:数字图像处理与机器视觉:Visual C++与Matlab实现(第2版)

      展开 +

      收起 -

      下载地址:百度网盘下载
      机器学习算法 相关电子书
      读者心得
      网友NO.40259
      网友NO.40259

      个人学习机器学习的路线规划 1 最快的入门方式,就是先百度、必应一下,了解下机器学习的概念。2 推荐阅读《机器学习实战》了解下机器学习相关的算法。我之前也看过机械工业出版社的《机器学习》、也看过点周志华老师的《机器学习》,前一本概念太多,后一本公式也挺多。《机器学习实战》相对来说要好得多,先介绍点理论背景,在基于python介绍下算法的实现以及一两个案例。3 很多人都觉得机器学习需要很好的数学功底,于是学习机器学习前,先捧着高数、线代、概率论看,结果看了两天,觉得枯燥无味,就打算放弃。其实没必要的,结合上面的《机器学习实战》,遇到什么公式,进行相应的复习就行了,这也是为什么把数学放在第三个步骤。其实机器学习里面能理解高数的求导、线代的矩阵以及向量、概率的期望方差等就差不多了,其他有需要的话针对学习就行。4 学习机器学习肯定是要看吴恩达老师的公开课了,公开课的地址,我刚看了两集,感觉还是非常不错的。5 学习Spark MLLib相关的算法实现,如果有时间的话,可以看看源码。

      网友NO.43519
      网友NO.43519

      从对机器学习充满好奇与畏惧,到对各种算法稍有理解以及围绕推荐场景的编码实践,算是对机器学习有了一个入门的体验。但是中间也踩过不少坑,比如啃过线性代数的教材、看过无聊的机器学习课程、追过高端的机器学习书籍、陷入一个算法无法自拔(最后也没整明白)...其实,学习机器学习没有那么难,也很容易走偏。

      网友NO.25084
      网友NO.25084

      出于许多充分的原因,许多高质量的机器学习教育资源往往对理论非常关注,尤其是在最开始打基础的时候。但是,现在的风气似乎变成了一开始就为了实践应用而学习。不过万幸,随着各种资源的进步,理论和实践也随之融合的更加紧密。

      码农之家

      曹绍祺 提供上传

      资源
      47
      粉丝
      45
      喜欢
      186
      评论
      17

      Copyright 2018-2021 www.xz577.com 码农之家

      版权投诉 / 书籍推广:520161757@qq.com