当前位置:首页 > 程序设计 >
《强化学习精要:核心算法与TensorFlow实现》电子书封面

强化学习精要:核心算法与TensorFlow实现

  • 发布时间:2019年08月02日 09:06:44
  • 作者:冯超
  • 大小:87.5 MB
  • 类别:算法电子书
  • 格式:PDF
  • 版本:超清完整版
  • 评分:7.4

    强化学习精要:核心算法与TensorFlow实现 PDF 超清完整版

      给大家带来的一篇关于算法相关的电子书资源,介绍了关于算法、TensorFlow方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小87.5 MB,冯超编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:8.1。

      内容介绍

      强化学习精要:核心算法与TensorFlow实现

      强化学习精要:核心算法与TensorFlow实现

      内容介绍

      《强化学习精要:核心算法与TensorFlow 实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同时介绍了这些算法的具体实现方式。从基本的马尔可夫决策过程,到各种复杂的强化学习算法,读者都可以从本书中学习到。本书除了介绍这些算法的原理,还深入分析了算法之间的内在联系,可以帮助读者举一反三,掌握算法精髓。书中介绍的代码可以帮助读者快速将算法应用到实践中。

      目录

      • 第一部分强化学习入门与基础知识
      • 1 引言2
      • 1 1 强化学习的概念            2
      • 1 1 1 巴浦洛夫的狗      3
      • 1 1 2 俄罗斯方块        4
      • 1 2 站在被实验者的角度看问题           5
      • 1 3 强化学习效果的评估      8
      • 1 3 1 不断试错            8
      • 1 3 2 看重长期回报      8
      • 1 4 强化学习与监督学习      9
      • 1 4 1 强化学习与监督学习的本质   9
      • 1 4 2 模仿学习            10
      • 1 5 强化学习的实验环境      11
      • 1 5 1 Arcade Learning Environment    12
      • 1 5 2 Box2D               12
      • 1 5 3 MuJoCo               13
      • 1 5 4 Gym                 14
      • 1 6 本书的主要内容            15
      • 1 7 参考资料       16
      • 2 数学与机器学习基础17
      • 2 1 线性代数基础              17
      • 2 2 对称矩阵的性质            21
      • 2 2 1 特征值与特征向量             21
      • 2 2 2 对称矩阵的特征值和特征向量              22
      • 2 2 3 对称矩阵的对角化             23
      • 2 3 概率论         24
      • 2 3 1 概率与分布        24
      • 2 3 2 最大似然估计      27
      • 2 4 重要性采样     29
      • 2 5 信息论基础     33
      • 2 6 KL 散度         35
      • 2 7 凸函数及其性质            39
      • 2 8 机器学习的基本概念      41
      • 2 9 机器学习的目标函数      43
      • 2 10 总结             45
      • 3 优化算法47
      • 3 1 梯度下降法     47
      • 3 1 1 什么是梯度下降法             47
      • 3 1 2 优雅的步长        48
      • 3 2 动量算法       53
      • 3 3 共轭梯度法     59
      • 3 3 1 精妙的约束        59
      • 3 3 2 共轭                60
      • 3 3 3 优化步长的确定    63
      • 3 3 4 Gram-Schmidt 方法             64
      • 3 3 5 共轭梯度            65
      • 3 4 自然梯度法     69
      • 3 4 1 基本概念            69
      • 3 4 2 Fisher 信息矩阵    71
      • 3 4 3 自然梯度法目标公式           76
      • 3 5 总结             77
      • 4 TensorFlow 入门78
      • 4 1 TensorFlow 的基本使用方法           78
      • 4 2 TensorFlow 原理介绍      82
      • 4 2 1 创建变量的scope                83
      • 4 2 2 创建一个Variable 背后的故事              89
      • 4 2 3 运算操作            94
      • 4 2 4 tf gradients           96
      • 4 2 5 Optimizer             102
      • 4 2 6 TensorFlow 的反向传播技巧   106
      • 4 2 7 arg_scope 的使用               109
      • 4 3 TensorFlow 的分布式训练               113
      • 4 3 1 基于MPI 的数据并行模型     114
      • 4 3 2 MPI 的实现:mpi_adam          121
      • 4 4 基于TensorFlow 实现经典网络结构   122
      • 4 4 1 多层感知器        122
      • 4 4 2 卷积神经网络      124
      • 4 4 3 循环神经网络      126
      • 4 5 总结             129
      • 4 6 参考资料       129
      • 5 Gym 与Baselines 130
      • 5 1 Gym              130
      • 5 1 1 Gym 的安装        130
      • 5 1 2 Gym 的基本使用方法           132
      • 5 1 3 利用Gym 框架实现一个经典的棋类游戏:蛇棋       134
      • 5 2 Baselines        138
      • 5 2 1 Baselines 中的Python 3 新特性              139
      • 5 2 2 tf_util                 141
      • 5 2 3 对Gym 平台的扩展             142
      • 5 3 总结             144
      • 6 强化学习基本算法145
      • 6 1 马尔可夫决策过程          145
      • 6 1 1 MDP:策略与环境模型         145
      • 6 1 2 值函数与Bellman 公式         147
      • 6 1 3 “表格式”Agent                151
      • 6 2 策略迭代       153
      • 6 2 1 策略迭代法        153
      • 6 2 2 策略提升的证明    159
      • 6 2 3 策略迭代的效果展示           160
      • 6 3 价值迭代       162
      • 6 3 1 N 轮策略迭代      162
      • 6 3 2 从动态规划的角度谈价值迭代              165
      • 6 3 3 价值迭代的实现    167
      • 6 4 泛化迭代       168
      • 6 4 1 两个极端            168
      • 6 4 2 广义策略迭代法    169
      • 6 4 3 泛化迭代的实现    170
      • 6 5 总结             171
      • 第二部分最优价值算法
      • 7 Q-Learning 基础173
      • 7 1 状态转移概率:从掌握到放弃     

      学习笔记

      Tensorflow 同时载入多个模型的实例讲解

      有时我们希望在一个python的文件空间同时载入多个模型,例如 我们建立了10个CNN模型,然后我们又写了一个预测类Predict,这个类会从已经保存好的模型restore恢复相应的图结构以及模型参数。然后我们会创建10个Predict的对象Instance,每个Instance负责一个模型的预测。 Predict的核心为: class Predict: def __init__(self....): 创建sess 创建恢复器tf.train.Saver 从恢复点恢复参数:tf.train.Saver.restore(...) def predict(self,...): sess.run(output,feed_dict={输入}) 如果我们直接轮流生成10个不同的Predict 对象的话,我们发现tensorflow是会报类似于下面的错误: File "/home/jiangminghao/.local/lib/python3.5/site-packages/tensorflow/python/framework/errors_impl.py", lin……

      tensorflow实现图像的裁剪和填充方法

      tensorflow里面提供了实现图像进行裁剪和填充的函数,就是tf.image.resize_image_with_crop_or_pad(img,height,width )。img表示需要改变的图像,height是改变后图像的高度,width是宽度。 例如: import matplotlib.pyplot as plt;import tensorflow as tf; image_raw_data_jpg = tf.gfile.FastGFile('11.jpg', 'r').read() with tf.Session() as sess:img_data_jpg = tf.image.decode_jpeg(image_raw_data_jpg)img_data_jpg = tf.image.convert_image_dtype(img_data_jpg, dtype=tf.float32)crop = tf.image.resize_image_with_crop_or_pad(img_data_jpg, 500, 500)pad = tf.image.resize_image_with_crop_or_pad(img_data_jpg, 2000, 2000) plt.figure(1)plt.imshow(crop.eval())plt.figure(2)plt.imshow(pad.eval())plt.show() 结果: 以上这篇tensorflow实现图像的裁剪和填充方……

      tensorflow实现简单逻辑回归

      逻辑回归是机器学习中很简答的一个栗子,这篇文章就是要介绍如何使用tensorflow实现一个简单的逻辑回归算法。 逻辑回归可以看作只有一层网络的前向神经网络,并且参数连接的权重只是一个值,而非矩阵。公式为:y_predict=logistic(X*W+b),其中X为输入,W为输入与隐含层之间的权重,b为隐含层神经元的偏置,而logistic为激活函数,一般为sigmoid或者tanh, y_predict为最终预测结果。 逻辑回归是一种分类器模型,需要木便函数不断的优化参数,这里目标函数为y_predict与真实标签Y之间的L2距离,使用随机梯度下降算法来更新权重和偏置。 废话不多说,贴代码: # -*- coding:utf-8 -*-#功能: 使用tensorflow实现一个简单的……

      tensorflow 恢复指定层与不同层指定不同学习率的方法

      如下所示: #tensorflow 中从ckpt文件中恢复指定的层或将指定的层不进行恢复:#tensorflow 中不同的layer指定不同的学习率 with tf.Graph().as_default():#存放的是需要恢复的层参数 variables_to_restore = [] #存放的是需要训练的层参数名,这里是没恢复的需要进行重新训练,实际上恢复了的参数也可以训练 variables_to_train = [] for var in slim.get_model_variables(): excluded = False for exclusion in fine_tune_layers: #比如fine tune layer中包含logits,bottleneck if var.op.name.startswith(exclusion): excluded = True break if not excluded: variables_to_restore.append(var) #print('var to restore :',var) else: variables_to_train.append(var) #print('var to train: ',var) #这里省略掉一些步骤,进入训练步骤: #将……

      以上就是本次介绍的算法电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:Go语言从入门到进阶实战

      下一篇:项目管理:计划、进度和控制的系统方法

      展开 +

      收起 -

      • 《强化学习精要:核心算法与TensorFlow实现》PDF下载

      下载地址:百度网盘下载
      算法相关电子书
      TensorFlow:实战Google深度学习框架
      TensorFlow:实战Google深度学习框架 影印第2版

      本书是TensorFlow入门参考书,旨在帮助读者以快速、有效的方式上手TensorFlow和深度学习,首度全面支持TensorFlow1.4.x代码,大量增补新版独有核心功能

      立即下载
      零起点TensorFlow与量化交易
      零起点TensorFlow与量化交易 完整扫描版

      这是一本让你轻松了解神经网络与量化投资的实战教程系统讲解,逐步深入,通过大量的实际案例,让初学者快速掌握神经网络和金融量化分析的基本编程

      立即下载
      深度学习之TensorFlow:入门、原理与进阶实战
      深度学习之TensorFlow:入门、原理与进阶实战 中文扫描版

      这本书通过大量的实例,全面而深入地讲解了深度学习神经网络原理和TensorFlow使用方法两方面的内容,通俗易懂,实用性强,特别适合TensorFlow深度学习的初学者和进阶读者作为自学教程阅读

      立即下载
      机器学习实战:基于Scikit-Learn和TensorFlow
      机器学习实战:基于Scikit-Learn和TensorFlow 扫描版

      本书作者曾经是谷歌工程师,在2013年至2016年主导了YouTube的视频分类工程,拥有丰富的机器学习项目经验。本书从开发者的实践角度,在动手写代码的过程中,循序渐进地了解机器学习的理论知

      立即下载
      TensorFlow机器学习项目实战
      TensorFlow机器学习项目实战 影印版

      TensorFlow机器学习领域研究和应用的热门对象,这里介绍如何使用TensorFlow库实现各种各样的模型,降低学习门槛,为读者解决问题提供详细的方法和指导

      立即下载
      TensorFlow+Keras深度学习人工智能实践应用
      TensorFlow+Keras深度学习人工智能实践应用 超清影印版

      本书通过大量的范例浅入深地讲解Keras与TensorFlow深度学习类神经网络,提供安装、上机操作指南,同时辅以大量范例程序介绍TensorFlow + Keras深度学习方面的知识

      立即下载
      读者留言
      码农之家

      码农之家 提供上传

      资源
      25
      粉丝
      27
      喜欢
      311
      评论
      19

      Copyright 2018-2020 www.xz577.com 码农之家

      投诉 / 推广 / 赞助:QQ:520161757