当前位置：主页 > 书籍配套资源 > 机器学习配套资源

《机器学习与R语言》素材

更新：2022-04-06
大小：10.2 MB
类别：机器学习
作者：Brett、Lantz
出版：机械工业出版社
格式：PDF

资源介绍
相关推荐

随着大数据的概念变得越来越流行，对数据的探索、分析和预测成为大数据分析领域的基本技能之一。作为探索和分析数据的基本理论和工具，机器学习和数据挖掘成为时下的热门技术之一。R作为功能强大并且免费的数据分析工具，在数据分析领域获得了越来越多用户的青睐。本书介绍如何应用R来进行现实世界问题的机器学习，以及如何从数据中获取可以付诸行动的洞察力。

本书的作者Brett Lantz在机器学习领域具有十余年的实践经验。他在本书中介绍了多种重要的机器学习算法。在给出相应的机器学习算法的核心理论之后，都给出了一个实际的案例，从对案例数据的探索、整理，到模型的建立和模型的评估，每一步都给出了详尽的步骤和R代码。
本书共分12章。第1章介绍机器学习的基本概念和理论，并介绍用于机器学习的R软件环境的准备。第2章介绍如何应用R来管理数据，进行数据的探索分析和数据可视化。第3章到第9章介绍典型的机器学习算法和案例，包括：k近邻分类算法、朴素贝叶斯算法、决策树和规则树、回归预测、黑盒算法——神经网络和支持向量机、关联分析、k均值聚类。伴随着这些算法的介绍，书中给出了大量的实际案例，并给出了详细的分析步骤，例如乳腺癌的判断、垃圾短信的过滤、贷款违约的预测、毒蘑菇的判别、医疗费用的预测、建筑用混凝土强度的预测、光学字符的识别、超市购物篮关联分析以及市场细分等。第10章介绍模型性能评价的原理和方法。第11章给出提高模型性能的几种常用方法。第12章讨论用R进行机器学习时可能遇到的一些高级专题，例如特殊形式的数据、大数据集的处理、并行计算和CPU计算等技术。

R本身是一款十分优秀的数据分析和数据可视化软件，其中包括大量用于机器学习的添加包。本书以机器学习算法为主线，通过案例学习的形式来组织内容，脉络清晰，并且各章自成体系。读者可以从头逐章学习，也可以找到自己所需要的内容进行学习。读者只需要具有R的一些基本知识，不需要具备机器学习的深厚基础。不管是R初学者，还是熟练的R用户都能从书中找到对自己有用的内容。

译者曾经应用本书的部分内容进行教学，学生都反映这些内容具有极强的实用价值，许多内容可以直接或者略加修改就可以应用到他们的实际工作中。我们有幸受机械工业出版社委托将此书译成中文，希望中文版的出版能够给国内读者学习R与机器学习带来方便。

在本书的翻译过程中，得到了王春华编辑的大力支持和帮助。本书责任编辑盛思源老师具有丰富的经验，为本书的出版付出了大量的劳动，这里对她们的支持和帮助表示衷心的感谢。本书的翻译工作由李洪成、许金炜和李舰共同完成，丁一飞协助翻译了本书的部分内容，全书由李洪成进行修改并统一定稿。

由于时间和水平所限，难免会有不当之处，希望同行和读者多加指正。
李洪成