机器学习系统设计

机器学习系统设计 PDF 高清版

  • 大小:43.2 MB
  • 类型:机器学习
  • 格式:PDF
  • 热度:820
  • 作者:Willi、Richert Luis、P
  • 更新:2020-09-26 10:46:16
vip 立即下载( 43.2 MB )
关注公众号免费下载
版权投诉 / 资源反馈(本资源由用户 谷秋荷 投稿)

本站精选了一篇机器学习相关的资料,介绍了关于机器学习、系统设计方面,格式为PDF,资源大小43.2 MB,目前在机器学习类资源综合评分为:7.9分。

如今,机器学习正在互联网上下掀起热潮,而Python则是非常适合开发机器学习系统的一门优秀语言。作为动态语言,它支持快速探索和实验,并且针对Python的机器学习算法库的数量也与日俱增。本书最大的特色,就是结合实例分析教会读者如何通过机器学习解决实际问题。 本书将向读者展示如何从原始数据中发现模式,首先从Python与机器学习的关系讲起,再介绍一些库,然后就开始基于数据集进行比较正式的项目开发了,涉及建模、推荐及改进,以及声音与图像处理。通过流行的开源库,我们可以掌握如何高效处理文本、图片和声音。同时,读者也能掌握如何评估、比较和选择适用的机器学习技术。 举几个例子,我们会介绍怎么把StackOverflow的回答按质量高低进行分类,怎么知道某个音乐文件是爵士风格,还是重金属摇滚风格。另外,本书还涵盖了主题建模、购物习性分析及云计算等高级内容。总之,通过学习本书,读者可以掌握构建自己所需系统的各方面知识,并且学以致用,解决自己面临的现实问题。 读者只要具有一定的Python编程经验,能够自己安装和使用开源库,就足够了,即使对机器学习一点了解都没有也没关系。本书不会讲机器学习算法背后的数学。 目录 第1章 Python机器学习入门 1 1.1 梦之队:机器学习与Python 1 1.2 这本书将教给你什么(以及不会教什么) 2 1.3 遇到困难的时候怎么办 3 1.4 开始 4 1.4.1 NumPy、SciPy和Matplotlib简介 4 1.4.2 安装Python 5 1.4.3 使用NumPy和SciPy智能高效地处理数据 5 1.4.4 学习NumPy 5 1.4.5 学习SciPy 9 1.5 我们第一个(极小的)机器学习应用 10 1.5.1 读取数据 10 1.5.2 预处理和清洗数据 11 1.5.3 选择正确的模型和学习算法 12 1.6 小结 20 第2章 如何对真实样本分类 22 2.1 Iris数据集 22 2.1.1 第一步是可视化 23 2.1.2 构建第一个分类模型 24 2.2 构建更复杂的分类器 28 2.3 更复杂的数据集和更复杂的分类器 29 2.3.1 从Seeds数据集中学习 29 2.3.2 特征和特征工程 30 2.3.3 最邻近分类 30 2.4 二分类和多分类 33 2.5 小结 34 第3章 聚类:寻找相关的帖子 35 3.1 评估帖子的关联性 35 3.1.1 不应该怎样 36 3.1.2 应该怎样 36 3.2 预处理:用相近的公共词语个数来衡量相似性 37 3.2.1 将原始文本转化为词袋 37 3.2.2 统计词语 38 3.2.3 词语频次向量的归一化 40 3.2.4 删除不重要的词语 41 3.2.5 词干处理 42 3.2.6 停用词兴奋剂 44 3.2.7 我们的成果和目标 45 3.3 聚类 46 3.3.1 K均值 46 3.3.2 让测试数据评估我们的想法 49 3.3.3 对帖子聚类 50 3.4 解决我们最初的难题 51 3.5 调整参数 54 3.6 小结 54 第4章 主题模型 55 4.1 潜在狄利克雷分配(LDA) 55 4.2 在主题空间比较相似度 59 4.3 选择主题个数 64 4.4 小结 65 第5章 分类:检测劣质答案 67 5.1 路线图概述 67 5.2 学习如何区分出优秀的答案 68 5.2.1 调整样本 68 5.2.2 调整分类器 68 5.3 获取数据 68 5.3.1 将数据消减到可处理的程度 69 5.3.2 对属性进行预选择和处理 70 5.3.3 定义什么是优质答案 71 5.4 创建第一个分类器 71 5.4.1 从k邻近(kNN)算法开始 71 5.4.2 特征工程 72 5.4.3 训练分类器 73 5.4.4 评估分类器的性能 74 5.4.5 设计更多的特征 74 5.5 决定怎样提升效果 77 5.5.1 偏差?方差及其折中 77 5.5.2 解决高偏差 78 5.5.3 解决高方差 78 5.5.4 高偏差或低偏差 78 5.6 采用逻辑回归 81 5.6.1 一点数学和一个小例子 81 5.6.2 在帖子分类问题上应用逻辑回归 83 5.7 观察正确率的背后:准确率和召回率 84 5.8 为分类器瘦身 87 5.9 出货 88 5.10 小结 88 第6章 分类II:情感分析 89 6.1 路线图概述 89 6.2 获取推特(Twitter)数据 89 6.3 朴素贝叶斯分类器介绍 90 6.3.1 了解贝叶斯定理 90 6.3.2 朴素 91 6.3.3 使用朴素贝叶斯进行分类 92 6.3.4 考虑未出现的词语和其他古怪情况 94 6.3.5 考虑算术下溢 95 6.4 创建第一个分类器并调优 97 6.4.1 先解决一个简单问题 97 6.4.2 使用所有的类 99 6.4.3 对分类器的参数进行调优 101 6.5 清洗推文 104 6.6 将词语类型考虑进去 106 6.6.1 确定词语的类型 106 6.6.2 用SentiWordNet成功地作弊 108 6.6.3 我们第一个估算器 110 6.6.4 把所有东西融合在一起 111 6.7 小结 112 第7章 回归:推荐 113 7.1 用回归预测房价 113 7.1.1 多维回归 116 7.1.2 回归里的交叉验证 116 7.2 惩罚式回归 117 7.2.1 L1和L2惩罚 117 7.2.2 在Scikit-learn中使用Lasso或弹性网 118 7.3 P大于N的情形 119 7.3.1 基于文本的例子 120 7.3.2 巧妙地设置超参数(hyperparameter) 121 7.3.3 评分预测和推荐 122 7.4 小结 126 第8章 回归:改进的推荐 127 8.1 改进的推荐 127

相关资源

  • 简明线性代数

    简明线性代数 课后答案

    邓小成、林剑鸣、肖冰主编的《简明线性代数(普通高等教育十二五应用型本科规划教材)》共分四章,内容包括矩阵与行列式、线性方程组与矩阵的初等变换、向量空间初步、特征值与二次型。各章节后均配有适量的习题,书后附有参考答案。另外还收录了行列式的排列逆序定义、若干应用问题、硕士研究生入学考试线性代数试题及线性代数发展简史等。 本书可作为高等院校教材,也可供读者参加硕士研究生入学考试自学自测和科技工作者参考。 目录

    大小:1.72 MB线性代数课后答案

  • TCL脚本学习

    大小:3.4 MBTCL脚本

  • 《电脑办公(Windows 10 + Office 2016)从新手到高手》电子资源

    《电脑办公(Windows 10 + Office 2016)从新手到高手》电子资源

    内容简介 《电脑办公(Windows 10 Office 2016)从新手到高手》以零基础讲解为宗旨,用实例引导读者学习,深入浅出地介绍了电脑办公的相关知识和操作方法。《电脑办公(Windows 10 Office 2016)从新手到高手》分为6篇,共21章。第1篇【办公基础篇】介绍了电脑办公的基础知识、个性化办公环境的设置方法、打字方法,以及如何高效管理办公文件等;第2篇【Word办公应用篇】介绍了Word 2016的基本操作、Word的图文混排,以及长文档的高级排版等;第3篇【Excel办公

    大小:3.7 GB电脑办公配套资源

  • Hippy v2.7 跨端开发框架文档

    Hippy 是一个新生的跨端开发框架,目标是使开发者可以只写一套代码就直接运行于三个平台(iOS、Android 和 Web)。Hippy 的设计是面向传统 Web 开发者的,特别是之前有过 React Native 和 Weex 开发经验的开发者用起来会更为顺手,Hippy 致力于让前端开发跨端 App 更加容易。 目录 起步 Hippy-React Hippy-Vue 样式

    大小:6.22 MBHippy

  • RHEL 8 with Podman, image builder and web

    RHEL 8 with Podman, image builder and web

    Working with Linux containers on RHEL 8 with Podman, image builder and web console December 11, 2019 Xuegang Jin RED HAT BLOG Latest posts By product By channel SHARE Customers need small modular tools to work with containers, and Red Hat Enterprise Linux

    大小:1.07 MBlinux

  • C语言程序设计

    C语言程序设计 课后答案

    本书采用项目式编写体例,通过大量的案例,详细介绍C语言编程的基础知识和基本操作,帮助学生掌握使用Turbo C进行C语言程序设计的方法。全书共11个项目,内容主要包括C语言基础知识、选择结构设计、循环结构设计、数组、函数、指针、图形处理等。在每个项目的后均附有思考与练习,使学生能够巩固本项目所学知识。 本书适合作为中等职业学校C语言程序设计课程的教材,也可作为C语言初学者的自学参考书。 目录 项目一 初识C语言来自计算机的问

    大小:324 KBC语言课后答案

  • gRPC v1.0 官方手册

    gRPC v1.0 官方手册

    gRPC+官方文档中文版 gRPC(http://www.oschina.net/p/grpc-framework) 是一个高性能、开源和通用的 RPC 框架,面向移动和 HTTP/2 设计。目前提供 C、Java 和 Go 语言版本,分别是:grpc, grpc-java,grpc-go. 其中 C 版本支持 C, C++, Node.js, Python, Ruby, Objective-C, PHP 和 C# 支持. gRPC 基于 HTTP/2 标准设计,带来诸如双向流、流控、头部压缩、单 TCP

    大小:1.2 MBgRPC官网

  • 《Visual Basic 程序设计案例教程》源代码,教案

    《Visual Basic 程序设计案例教程》源代码,教案

    内容简介 《Visual Basic程序设计案例教程》是根据教育部关于高等学校非计算机专业计算机基础三层次教学的要求和《全国计算机等级考试二级Visual Basic程序设计考试大纲》(2008年*版)的要求,结合当前计算机科学技术的*发展和Visual Basic程序设计教学的实际情况,以目前使用最多的Visual Basic 6.0版本为例编写的。 《Visual Basic程序设计案例教程》共分15章,全面介绍了Visual Basic面向对象的可视化程序开发方法,内容包括Visual Basic程

    大小:4.88 MBVB教程配套资源

下载地址

相关声明:

学习笔记