当前位置:首页 > 其它 >
《强化学习实战:强化学习在阿里的技术演进和业务创新》电子书封面

强化学习实战:强化学习在阿里的技术演进和业务创新

  • 发布时间:2019年11月22日 09:07:19
  • 作者:笪庆 曾安祥
  • 大小:125 MB
  • 类别:强化学习电子书
  • 格式:PDF
  • 版本:影印版
  • 评分:9.9

    强化学习推荐

    强化学习实战:强化学习在阿里的技术演进和业务创新 PDF 影印版

      给大家带来的一篇关于强化学习相关的电子书资源,介绍了关于强化学习、阿里技术、业务创新方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小125 MB,笪庆 曾安祥编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.7分

      Tags:

      内容介绍

      强化学习实战:强化学习在阿里的技术演进和业务创新 PDF

      《强化学习实战:强化学习在阿里的技术演进和业务创新》汇集了阿里巴巴一线算法工程师在强化学习应用方面的经验和心得,覆盖了阿里巴巴集团多个事业部的多条业务线。《强化学习实战:强化学习在阿里的技术演进和业务创新》系统地披露在互联网级别的应用上使用强化学习的技术细节,更包含了算法工程师对强化学习的深入理解、思考和创新。作为算法工程师,你将了解到强化学习在实际应用中的建模方法、常见的问题以及对应的解决思路,提高建模和解决业务问题的能力;对于强化学习方向的研究人员,你将了解到在游戏之外更多实际的强化学习问题,以及对应的解决方案,扩宽研究视野;对于机器学习爱好者,你将了解到阿里巴巴的一线机器学习算法工程师是如何发现问题、定义问题和解决问题的,激发研究兴趣以及提升专业素养。

      《强化学习实战:强化学习在阿里的技术演进和业务创新》适合算法工程师、强化学习方向的专业人员阅读,也可供机器学习爱好者参考。

      目录

      • 第1 章 强化学习基础 1
      • 1.1 引言 2
      • 1.2 起源和发展 3
      • 1.3 问题建模 5
      • 1.4 常见强化学习算法 8
      • 1.4.1 基于值函数的方法 9
      • 1.4.2 基于直接策略搜索的方法 12
      • 1.5 总结 14
      • 第2 章 基于强化学习的实时搜索排序策略调控 15
      • 2.1 研究背景 16
      • 2.2 问题建模 17
      • 2.2.1 状态定义 17
      • 2.2.2 奖赏函数设计 18
      • 2.3 算法设计 19
      • 2.3.1 策略函数 19
      • 2.3.2 策略梯度 20
      • 2.3.3 值函数的学习 21
      • 2.4 奖赏塑形 22
      • 2.5 实验效果 25
      • 2.6 DDPG 与梯度融合 27
      • 2.7 总结与展望 28
      • 第3 章 延迟奖赏在搜索排序场景中的作用分析 30
      • 3.1 研究背景 31
      • 3.2 搜索交互建模 31
      • 3.3 数据统计分析 33
      • 3.4 搜索排序问题形式化 36
      • 3.4.1 搜索排序问题建模 36
      • 3.4.2 搜索会话马尔可夫决策过程 38
      • 3.4.3 奖赏函数 39
      • 3.5 理论分析 40
      • 3.5.1 马尔可夫性质 40
      • 3.5.2 折扣率 41
      • 3.6 算法设计 44
      • 3.7 实验与分析 48
      • 3.7.1 模拟实验 48
      • 3.7.2 搜索排序应用 51
      • 第4 章 基于多智能体强化学习的多场景联合优化 54
      • 4.1 研究背景 55
      • 4.2 问题建模 57
      • 4.2.1 相关背景简介 57
      • 4.2.2 建模方法 58
      • 4.3 算法应用 65
      • 4.3.1 搜索与电商平台 65
      • 4.3.2 多排序场景协同优化 66
      • 4.4 实验与分析 69
      • 4.4.1 实验设置 69
      • 4.4.2 对比基准 70
      • 4.4.3 实验结果 70
      • 4.4.4 在线示例 73
      • 4.5 总结与展望 75
      • 第5 章 虚拟淘宝 76
      • 5.1 研究背景 77
      • 5.2 问题描述 79
      • 5.3 虚拟化淘宝 80
      • 5.3.1 用户生成策略 81
      • 5.3.2 用户模仿策略 83
      • 5.4 实验与分析 85
      • 5.4.1 实验设置 85
      • 5.4.2 虚拟淘宝与真实淘宝对比 85
      • 5.4.3 虚拟淘宝中的强化学习 87
      • 5.5 总结与展望 90
      • 第6 章 组合优化视角下基于强化学习的精准定向广告OCPC 业务优化92
      • 6.1 研究背景 93
      • 6.2 问题建模 94
      • 6.2.1 奖赏设计 94
      • 6.2.2 动作定义 94
      • 6.2.3 状态定义 95
      • 6.3 模型选择 100
      • 6.4 探索学习 102
      • 6.5 业务实战 103
      • 6.5.1 系统设计 103
      • 6.5.2 奖赏设计 105
      • 6.5.3 实验效果 106
      • 6.6 总结与展望 106
      • 第7 章 策略优化方法在搜索广告排序和竞价机制中的应用 108
      • 7.1 研究背景 109
      • 7.2 数学模型和优化方法 110
      • 7.3 排序公式设计 112
      • 7.4 系统简介 113
      • 7.4.1 离线仿真模块 114
      • 7.4.2 离线训练初始化 114
      • 7.5 在线策略优化 117
      • 7.6 实验与分析 118
      • 7.7 总结与展望 120
      • 第8 章 TaskBot——阿里小蜜的任务型问答技术 121
      • 8.1 研究背景 122
      • 8.2 模型设计 123
      • 8.2.1 意图网络 123
      • 8.2.2 信念跟踪 124
      • 8.2.3 策略网络 124
      • 8.3 业务应用 126
      • 8.4 总结与展望 127
      • 第9 章 DRL 导购——阿里小蜜的多轮标签推荐技术 128
      • 9.1 研究背景 129
      • 9.2 算法框架 130
      • 9.3 深度强化学习模型 133
      • 9.3.1 强化学习模块 133
      • 9.3.2 模型融合 134
      • 9.4 业务应用 135
      • 9.5 总结与展望 136
      • 第10 章 Robust DQN 在淘宝锦囊推荐系统中的应用 137
      • 10.1 研究背景 138
      • 10.2 Robust DQN 算法 140
      • 10.2.1 分层采样方法 140
      • 10.2.2 基于分层采样的经验池 141
      • 10.2.3 近似遗憾奖赏 142
      • 10.2.4 Robust DQN 算法 143
      • 10.3 Robust DQN 算法在淘宝锦囊上的应用 144
      • 10.3.1 系统架构 144
      • 10.3.2 问题建模 145
      • 10.4 实验与分析 147
      • 10.4.1 实验设置 148
      • 10.4.2 实验结果 148
      • 10.5 总结与展望 152
      • 第11 章 基于上下文因子选择的商业搜索引擎性能优化 153
      • 11.1 研究背景 154
      • 11.2 排序因子和排序函数 156
      • 11.3 相关工作 157
      • 11.4 排序中基于上下文的因子选择 158
      • 11.5 RankCFS:一种强化学习方法 162
      • 11.5.1 CFS 问题的 MDP 建模 162
      • 11.5.2 状态与奖赏的设计 163
      • 11.5.3 策略的学习 165
      • 11.6 实验与分析 166
      • 11.6.1 离线对比 167
      • 11.6.2 在线运行环境的评价 170
      • 11.6.3 双11 评价 171
      • 11.7 总结与展望 172
      • 第12 章 基于深度强化学习求解一类新型三维装箱问题 173
      • 12.1 研究背景 174
      • 12.2 问题建模 175
      • 12.3 深度强化学习方法 177
      • 12.3.1 网络结构 178
      • 12.3.2 基于策略的强化学习方法 179
      • 12.3.3 基准值的更新 180
      • 12.3.4 随机采样与集束搜索 180
      • 12.4 实验与分析 181
      • 12.5 小结 182
      • 第13 章 基于强化学习的分层流量调控 183
      • 13.1 研究背景 184
      • 13.2 基于动态动作区间的DDPG 算法 186
      • 13.3 实验效果 189
      • 13.4 总结与展望 189
      • 第14 章 风险商品流量调控 190
      • 14.1 研究背景 191
      • 14.2 基于强化学习的问题建模 192
      • 14.2.1 状态空间的定义 192
      • 14.2.2 动作空间的定义 193
      • 14.2.3 奖赏函数的定义 193
      • 14.2.4 模型选择 194
      • 14.2.5 奖赏函数归一化 196
      • 14.3 流量调控系统架构 196
      • 14.4 实验效果 197
      • 14.5 总结与展望 197
      • 参考文献 199

      以上就是本次介绍的强化学习电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:机器学习项目开发实战

      下一篇:Android并发开发

      展开 +

      收起 -

      下载地址:百度网盘下载
      强化学习 相关电子书
      揭秘深度强化学习
      揭秘深度强化学习 PDF 扫描超清版

      本书深度学习与强化学习的结合 AlphaGo核心算法,是一本书读懂深度学习、强化学习、神经网络(CNN/RNN/RCNN)的底层算法,讲解全面、语言描述通俗易懂,是深度强化学习算法入门的优选

      立即下载
      深入浅出强化学习:原理入门(含源码)
      深入浅出强化学习:原理入门(含源码) PDF 超清版

      本书以通俗易懂的语言深入浅出地介绍了强化学习的基本原理,涵盖强化学习基本方法和深度强化学习方法,还介绍了相应的数学基础和编程实例,思路明确、清晰易懂,是深度学习必备参考书

      立即下载
      Web安全之强化学习与GAN
      Web安全之强化学习与GAN PDF 原书完整版

      本书介绍强化学习和生成对抗网络的基础知识和实际应用,特别是在安全领域中攻防建设的实际应用,包含基于机器学习的恶意程序识别技术、AI安全的攻防知识、强化学习等知识

      立即下载
      强化学习精要:核心算法与TensorFlow实现
      强化学习精要:核心算法与TensorFlow实现 PDF 超清完整版

      《强化学习精要:核心算法与TensorFlow 实现》用通俗幽默的语言深入浅出地介绍了强化学习的基本算法与代码实现,为读者构建了一个完整的强化学习知识体系,同时介绍了这些算法的具体实现

      立即下载
      Python强化学习实战(含源码)
      Python强化学习实战(含源码) PDF 英文原版

      Python强化学习实战:应用OpenAI Gym和TensorFlow精通强化学习和深度强化学习 PDF+源码 增强学习是这种关键的深度学习方式 ,在智能化体及预测分析等行业有很多运用。这书共13章,包括增强学习的

      立即下载
      阿里巴巴最新2019Java开发手册1.5.0
      阿里巴巴最新2019Java开发手册1.5.0 PDF 完整超清版

      《 Java开发手册 》是阿里集团技术性精英团队的团体智慧结晶和经验交流,亲身经历了数次规模性第一线实战演练的检测及逐步完善,公布到业内后,诸多小区开发人员积极参加,相互打磨抛

      立即下载
      飞天开放平台编程指南:阿里云计算的实践
      飞天开放平台编程指南:阿里云计算的实践 PDF 高清版

      《飞天开放平台编程指南:阿里云计算的实践》 是阿里云计算官方作品,是阿里巴巴旗下重要的云计算及应用平台。飞天开放平台是阿里云计算有限公司自主研发的云计算平台。飞天开放平台

      立即下载
      阿里巴巴Java开发手册
      阿里巴巴Java开发手册 PDF 彩色影印版

      这本书愿景是码出高效,码出质量,提炼阿里巴巴集团技术团队的集体编程经验和软件设计智慧,浓缩成为立体的编程规范和实践,适合计算机相关行业的管理者和研发人员、高等院校的计算机专业师生、求职者等阅读

      立即下载
      读者心得
      93小时41分钟前回答

      浅谈使用java实现阿里云消息队列简单封装

      一、前言 最近公司有使用阿里云消息队列的需求,为了更加方便使用,本人用了几天时间将消息队列封装成api调用方式以方便内部系统的调用,现在已经完成,特此记录其中过程和使用到的相关技术,与君共勉。 现在阿里云提供了两种消息服务:mns服务和ons服务,其中我认为mns是简化版的ons,而且mns的消息消费需要自定义轮询策略的,相比之下,ons的发布与订阅模式功能更加强大(比如相对于mns,ons提供了消息追踪、日志、监控等功能),其api使用起来更加方便,而且听闻阿里内部以后不再对mns进行新的开发,只做维护,ons服务则会逐步替代mns服务成为阿里消息服务的主打产品,所以,如果有使用消……

      152小时12分钟前回答

      阿里云Centos 7.5安装Mysql的教程

      CentOS 7的yum源中貌似没有正常安装MySQL时的mysql-sever文件,需要去官网上下载。 # wget http://dev.mysql.com/get/mysql-community-release-el7-5.noarch.rpm # rpm -ivh mysql-community-release-el7-5.noarch.rpm # yum install mysql-community-server 成功安装之后重启mysql服务 # service mysqld restart 初次安装mysql是root账户是没有密码的 设置密码的方法语句以分号结束 # mysql -uroot mysql set password for ‘root'@‘localhost' = password('mypasswd'); 创建数据库并指定utf-8编码 mysql CREATE DATABASE xxxx DEFAULT CHARSET utf8 COLLATE utf8_general_ci 导入数据库 mysqluse 数据库 -- 然后使用source命令,后面参数为脚本文件(如这里用到的.sql) mysqlsource dbname.sql 以上所述是小编给大家介绍的阿里云C……

      26小时49分钟前回答

      Springboot实现阿里云通信短信服务有关短信验证码的发送功能

      前言 短信验证码是通过发送验证码到手机的一种有效的验证码系统。主要用于验证用户手机的合法性及敏感操作的身份验证。 现在市面上的短信服务平台有很多。大家在选择的时候未免会有些不好抉择。本人建议选择短信服务商应遵循以下几点: 服务商知名度高,业务流量大。(这样的平台可信度高) 服务稳定,不能经常宕机。(保证自身业务的流畅运行) 文档全面详细。(没文档怎么玩?) 最近的一个项目中,注册和修改密码时需要用到短信验证码校验手机号的功能。本人也是对比几家后,直接选择阿里云通信的短信服务。(本身项目服务器也是部署在阿里云上,但之前并不知道阿里云有短信服……

      111小时56分钟前回答

      Python pip替换为阿里源的方法步骤

      背景 由于 python 自带的源下载速度非常慢,特别是安装一些库的时候,甚至有时会失败。 pip国内的一些镜像   阿里云http://mirrors.aliyun.com/pypi/simple/   中国科技大学https://pypi.mirrors.ustc.edu.cn/simple/   豆瓣(douban)http://pypi.douban.com/simple/   清华大学https://pypi.tuna.tsinghua.edu.cn/simple/ 替换 首先在 windows 当前用户家的目录下,创建一个 pip 文件夹,然后创建一个pip.ini文件,修改文件内容为如下; [global] index-url = http://mirrors.aliyun.com/pypi/simple/ [install] trusted-host=mirrors.aliyun.com 备注 记得一定是pip.ini,如果没有开后缀的同学,记得把文件后缀打开,再修改文件的后缀为ini即可。 用户家目录为 C:\Users\**** # **** 就……

      码农之家

      融运馨 提供上传

      资源
      25
      粉丝
      27
      喜欢
      146
      评论
      9

      Copyright 2018-2021 www.xz577.com 码农之家

      版权投诉 / 书籍推广:520161757@qq.com