反馈 / 投诉
-
《机器学习:实用案例解析》源代码及数据集
2022-05-28 17:16:23 类别:机器学习
-
扫二维码手机浏览
资源介绍
为找资料的网友们整理了机器学习类书籍配套资源,介绍了关于机器学习、机器学习案例、机器学习方面的内容,本书是由机械工业出版社出版,已被252人关注,由许力强测试纠错,目前本书在机器学习类综合评分为:9.4分。
当今各行业,尤其是互联网,数据规模越来越大,要从中有效地发现模式来提高生产力,用传统的方式已经几乎不可能,只能借助计算机来完成诸多使命。因此,机器学习这一新兴的学科变得越来越重要,它已经在搜索、推荐、数据挖掘等多个领域闪耀光芒。机器学习是一门交叉学科,内容涉及概率论、统计学、高等数学、计算机科学等多门学科。该学科致力于设计一种让计算机具有“学习”能力的算法,通过发现经验数据中隐藏的模式,实现对未知数据的预测。
大数据时代是机器学习最美好的时代,因为数据不再是问题,各类问题都可以收集到海量的数据。但是,对于很多人来说,这一门交叉学科本身却神秘而陌生,对于没有系统学习过相关基础学科的人来说尤其感到“高不可攀”。如今已出版的机器学习相关书籍中,很多都有这个特点:公式多,晦涩难懂。这让很多程序员出身的人望而却步。然而,在第一次读到本书的英文版时,译者就彻底相信:机器学习完全可以讲解得通俗易懂,让知识的传递实现“润物细无声”。
本书秉承的原则是:实践出真知,只要多动手,没有攻克不了的技术难题。因此作者预期的阅读对象是如电脑黑客般的人,要求对技术有发自内心的求知欲和好奇心,愿意自己动手而非纸上谈兵。全书精心选择了12个机器学习案例,由浅入深,面面俱到,既有基础知识(如数据分析),也有当前热门的社交网站推荐案例。书中的每一个案例都由作者娓娓道来,逐一剖析关键算法的代码,没有丝毫学究气息,触动每个机器学习初学者的内心最深处。
书中所有算法都采用R语言实现。R语言是一门用于统计学的开源脚本语言,基于它的开源性,有来自世界各地的开源拥护者贡献的各种统计学相关的程序包,稳定且方便,尤其是它对数据可视化的支持,更是一柄利器,既轻巧又实用。书中所有源代码和数据在原书的官方网站上都可以免费下载。在阅读过程中,犹如作者亲至身侧,为你讲解代码和思路,为你排除错误和优化效果。
全书案例既有分类问题,也有回归问题;既包含监督学习,也涵盖无监督学习。所选择的案例妙趣横生,如分析UFO目击记录、破译密码、预测股票、分析美国参议员“结党”的情况,等等,这里就不“剧透”了,大家自己去享受学习的乐趣吧。
书中12个案例之间的依赖关系不是特别强(除R语言基础知识外,其余某几章仅有个别知识点之间存在依赖性),可以像连续剧一样,逐一播放,也可以像一个个小品一般,挑感兴趣的内容分别播放。学习完这些案例之后,相信你会窥见机器学习的一斑,然后再根据自己的实际情况更深入地学习。
本书翻译工作由三位来自互联网世界的工程师通力协作完成,其中,来自新浪微博的陈开江负责完成前言及第1~4章的翻译;来自阿里B2B的刘逸哲负责完成第5、8、9和11章的翻译;来自阿里一淘的孟晓楠负责完成第6、7、10和12章的翻译;同时,全书审校工作由来自北京理工大学的罗森林教授义务承担。
本书能够得以出版,首先要感谢机械工业出版社的吴怡编辑,是她给了我们三位工程师这个学习知识并传递知识的机会,她经验丰富,在翻译过程中给予了我们许多建设性的指导意见。其次,要感谢罗森林教授,他在百忙之中为我们担任全书的审校工作,从而让国内的机器学习者能感受到这本书应有的魅力。最后,我们要感谢互联网,因为译者与本书的缘分始于互联网,从看到原书、报名翻译、组成翻译团队、翻译过程中的讨论,所有这样都是通过互联网完成的。
虽然经过罗森林教授认真审校并且给我们提出了宝贵意见,但是由于译者本身水平有限,书中译文势必还存在不妥甚至错误之处,恳请机器学习界的广大前辈、同仁们不吝赐教,促使我们继续为大家更好地传递先进技术,让更多机器学习爱好者成为机器学习的黑客。
我们坚信集体智慧是再高的个人智慧都无法企及的,因此真诚希望大家一起来贡献自己的智慧。三位译者的微博分别为:http://weibo.com/kaijiangidan(陈开江,@刑无刀)、http://weibo.com/liuyizhe10(刘逸哲,@刘逸哲)、http://weibo.com/u/1911115643(孟晓楠,@XiaonanMeng)。无论是对翻译本身有任何意见或建议,还是对机器学习方面有心得,都欢迎大家到我们的微博上交流、切磋,我们一起贡献自己的智慧,在集体智慧中互相学习,共同进步。
封面图
目录
- 前言1
- 第1章 使用R语言9
- R与机器学习10
- 第2章 数据分析36
- 分析与验证36
- 什么是数据37
- 推断数据的类型40
- 推断数据的含义42
- 数值摘要表43
- 均值、中位数、众数44
- 分位数46
- 标准差和方差47
- 可视化分析数据49
- 列相关的可视化68
- 第3章 分类:垃圾过滤77
- 非此即彼:二分类77
- 漫谈条件概率81
- 试写第一个贝叶斯垃圾分类器82
- 第4章 排序:智能收件箱97
- 次序未知时该如何排序97
- 按优先级给邮件排序98
- 实现一个智能收件箱102
- 第5章 回归模型:预测网页访问量128
- 回归模型简介128
- 预测网页流量142
- 定义相关性152
- 第6章 正则化:文本回归155
- 数据列之间的非线性关系:超越直线155
- 避免过拟合的方法164
- 文本回归174
- 第7章 优化:密码破译182
- 优化简介182
- 岭回归188
- 密码破译优化问题193
- 第8章 PCA:构建股票市场指数203
- 无监督学习203
- 主成分分析204
- 第9章 MDS:可视化地研究参议员相似性212
- 基于相似性聚类212
- 如何对美国参议员做聚类219
- 第10章 kNN:推荐系统229
- k近邻算法229
- R语言程序包安装数据235
- 第11章 分析社交图谱239
- 社交网络分析239
- 用黑客的方法研究Twitter的社交关系图数据244
- 分析Twitter社交网络252
- 第12章 模型比较270
- SVM:支持向量机270
- 算法比较280
- 参考文献287
以上就是本次关于配套资源的介绍和部分内容,我们还整理了以往更新的其它相关电子书资源内容,可以在下方直接下载,关于相关的资源我们在下方做了关联展示,需要的朋友们也可以参考下。
下载地址
下载地址:网盘下载
机器学习相关资源
学习心得
欢迎发表评论:
- 最新更新
-
1
Java编程实战宝典 PDF电子书
类别:Java编程
-
2
自然语言处理原理与技术实现 PDF电子书
类别:自然语言
-
3
Vert.x应用开发实例教程 PDF电子书
类别:Vert.x
-
4
深入理解php:高级技巧、面向对象与核心技术(第3版) PDF电子书
类别:php
-
5
PHP经典实例(第3版) PDF电子书
类别:PHP实例
-
6
Django开发宝典 PDF电子书
类别:Django
-
7
Learning PHP设计模式 PDF电子书
类别:PHP编程
-
8
Java高并发编程详解:多线程与架构设计 PDF电子书
类别:Java编程
-
9
教孩子学编程:Python语言版 PDF电子书
类别:儿童编程
- 资料推荐
-
- 09-13嵌入式系统设计大学教程 课后答案
- 08-24计算机操作系统 课后答案
- 08-11后谷歌时代:大数据的没落及区块链经济的崛起 计算机书籍
- 01-02《C语言程序设计》教案,源代码
- 10-23Python程序设计入门到实战 计算机书籍
- 04-27《Visual Basic 开发从入门到精通》源程序
- 06-23概率论基础教程(第八版) 课后答案
- 01-24《Scratch 3.0少儿编程魔法课堂(全彩印+视频教学版)》配书资源
- 10-13Azkaban操作指南 编程资源
- 06-22系统架构设计:程序员向架构师转型之路 PDF电子书
《Python机器学习经典实例》学习感悟
初衷 在看到一位产品经理制定机器学习的计划并实施后,产生了同样的念头,非技术都在了解学习机器学习,我有什么理由不去学呢? 关于本书 本书(《 Python 机器学习经典实例 》)的标题经典实例让我非常感兴趣。 一直认为学习任何新事物,先上手实现简单的demo,再分析这个demo做了什么,怎么做,才能更快的学习。如果是在初始阶段就大量的学习理论,只会对要学习的东西……
给你选择Python语言实现机器学习算法的三大理由
基于以下三个原因,我们选择Python作为实现机器学习算法的编程语言:(1) Python的语法清晰;(2) 易于操作纯文本文件;(3) 使用广泛,存在大量的开发文档。 可执行伪代码 Python具有清晰的语法结构,大家也把它称作可执行伪代码(executable pseudo-code)。默认安装的Python开发环境已经附带了很多高级数据类型,如列表、元组、字典、集合、队列等,无需进一步编程就可以使用这些数据……