当前位置:首页 > 人工智能 >
《视觉SLAM十四讲:从理论到实践》电子书封面

视觉SLAM十四讲:从理论到实践

  • 发布时间:2020年05月18日 09:32:37
  • 作者:高翔
  • 大小:85.4 MB
  • 类别:视觉SLAM电子书
  • 格式:PDF
  • 版本:完整版
  • 评分:9.9

    视觉SLAM十四讲:从理论到实践 PDF 完整版

      给大家带来的一篇关于视觉SLAM相关的电子书资源,介绍了关于视觉、SLAM方面的内容,本书是由电子工业出版社出版,格式为PDF,资源大小85.4 MB,高翔编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.5。

      内容介绍

      《视觉SLAM十四讲:从理论到实践》系统介绍了视觉SLAM(同时定位与地图构建)所需的基本知识与核心算法,既包括数学理论基础,如三维空间的刚体运动、非线性优化,又包括计算机视觉的算法实现,例如多视图几何、回环检测等。此外,还提供了大量的实例代码供读者学习研究,从而更深入地掌握这些内容。

      目录

      • 第1 讲预备知识 1
      • 1.1 本书讲什么1
      • 1.2 如何使用本书3
      • 1.2.1 组织方式3
      • 1.2.2 代码5
      • 1.2.3 面向的读者6
      • 1.3 风格约定6
      • 1.4 致谢和声明7
      • 第2 讲初识SLAM 9
      • 2.1 引子:小萝卜的例子11
      • 2.2 经典视觉SLAM 框架17
      • 2.2.1 视觉里程计17
      • 2.2.2 后端优化19
      • 2.2.3 回环检测20
      • 2.2.4 建图21
      • 2.3 SLAM 问题的数学表述22
      • 2.4 实践:编程基础 25
      • 2.4.1 安装Linux 操作系统25
      • 2.4.2 Hello SLAM27
      • 2.4.3 使用cmake28
      • 2.4.4 使用库30
      • 2.4.5 使用IDE32
      • 第3 讲三维空间刚体运动37
      • 3.1 旋转矩阵39
      • 3.1.1 点和向量,坐标系39
      • 3.1.2 坐标系间的欧氏变换40
      • 3.1.3 变换矩阵与齐次坐标42
      • 3.2 实践:Eigen 44
      • 3.3 旋转向量和欧拉角48
      • 3.3.1 旋转向量48
      • 3.3.2 欧拉角50
      • 3.4 四元数51
      • 3.4.1 四元数的定义51
      • 3.4.2 四元数的运算53
      • 3.4.3 用四元数表示旋转55
      • 3.4.4 四元数到旋转矩阵的转换55
      • 3.5 * 相似、仿射、射影变换56
      • 3.6 实践:Eigen 几何模块57
      • 3.7 可视化演示60
      • 第4 讲李群与李代数62
      • 4.1 李群与李代数基础 64
      • 4.1.1 群64
      • 4.1.2 李代数的引出65
      • 4.1.3 李代数的定义 67
      • 4.1.4 李代数so(3) 67
      • 4.1.5 李代数se(3)68
      • 4.2 指数与对数映射69
      • 4.2.1 SO(3) 上的指数映射69
      • 4.2.2 SE(3) 上的指数映射.70
      • 4.3 李代数求导与扰动模型72
      • 4.3.1 BCH 公式与近似形式72
      • 4.3.2 SO(3) 李代数上的求导73
      • 4.3.3 李代数求导74
      • 4.3.4 扰动模型(左乘)75
      • 4.3.5 SE(3) 上的李代数求导76
      • 4.4 实践:Sophus76
      • 4.5 * 相似变换群与李代数.79
      • 4.6 小结81
      • 第5 讲相机与图像82
      • 5.1 相机模型 84
      • 5.1.1 针孔相机模型84
      • 5.1.2 畸变87
      • 5.1.3 双目相机模型 90
      • 5.1.4 RGB-D 相机模型92
      • 5.2 图像93
      • 5.3 实践:图像的存取与访问95
      • 5.3.1 安装OpenCV95
      • 5.3.2 操作OpenCV 图像96
      • 5.4 实践:拼接点云99
      • 第6 讲非线性优化104
      • 6.1 状态估计问题106
      • 6.1.1 最大后验与最大似然106
      • 6.1.2 最小二乘的引出 108
      • 6.2 非线性最小二乘109
      • 6.2.1 一阶和二阶梯度法110
      • 6.2.2 高斯牛顿法111
      • 6.2.3 列文伯格—马夸尔特方法113
      • 6.2.4 小结114
      • 6.3 实践:Ceres115
      • 6.3.1 Ceres 简介 116
      • 6.3.2 安装Ceres116
      • 6.3.3 使用Ceres 拟合曲线 117
      • 6.4 实践:g2o121
      • 6.4.1 图优化理论简介121
      • 6.4.2 g2o 的编译与安装122
      • 6.4.3 使用g2o 拟合曲线123
      • 6.5 小结128
      • 第7 讲视觉里程计1130
      • 7.1 特征点法132
      • 7.1.1 特征点132
      • 7.1.2 ORB 特征134
      • 7.1.3 特征匹配137
      • 7.2 实践:特征提取和匹配138
      • 7.3 2D−2D: 对极几何141
      • 7.3.1 对极约束141
      • 7.3.2 本质矩阵143
      • 7.3.3 单应矩阵146
      • 7.4 实践:对极约束求解相机运动148
      • 7.5 三角测量153
      • 7.6 实践:三角测量154
      • 7.6.1 三角测量代码154
      • 7.6.2 讨论156
      • 7.7 3D−2D:PnP157
      • 7.7.1 直接线性变换158
      • 7.7.2 P3P159
      • 7.7.3 Bundle Adjustment 161
      • 7.8 实践:求解PnP165
      • 7.8.1 使用EPnP 求解位姿165
      • 7.8.2 使用BA 优化166
      • 7.9 3D−3D:ICP172
      • 7.9.1 SVD 方法173
      • 7.9.2 非线性优化方法 175
      • 7.10 实践:求解ICP176
      • 7.10.1 SVD 方法176
      • 7.10.2 非线性优化方法178
      • 7.11 小结180
      • 第8 讲视觉里程计2182
      • 8.1 直接法的引出184
      • 8.2 光流(Optical Flow)185
      • 8.3 实践:LK 光流187
      • 8.3.1 使用TUM 公开数据集187
      • 8.3.2 使用LK 光流188
      • 8.4 直接法(Direct Method)192
      • 8.4.1 直接法的推导 192
      • 8.4.2 直接法的讨论195
      • 8.5 实践:RGB-D 的直接法196
      • 8.5.1 稀疏直接法196
      • 8.5.2 定义直接法的边197
      • 8.5.3 使用直接法估计相机运动 199
      • 8.5.4 半稠密直接法200
      • 8.5.5 直接法的讨论 202
      • 8.5.6 直接法优缺点总结 203
      • 第9 讲实践:设计前端205
      • 9.1 搭建VO 框架 206
      • 9.1.1 确定程序框架207
      • 9.1.2 确定基本数据结构208
      • 9.1.3 Camera 类210
      • 9.1.4 Frame 类212
      • 9.1.5 MapPoint 类 213
      • 9.1.6 Map 类 213
      • 9.1.7 Config 类 214
      • 9.2 基本的VO:特征提取和匹配216
      • 9.2.1 两两帧的视觉里程计216
      • 9.2.2 讨论224
      • 9.3 改进:优化PnP 的结果 224
      • 9.4 改进:局部地图 227
      • 9.5 小结233
      • 第10 讲后端1 235
      • 10.1 概述237
      • 10.1.1 状态估计的概率解释237
      • 10.1.2 线性系统和KF239
      • 10.1.3 非线性系统和EKF242
      • 10.1.4 EKF 的讨论243
      • 10.2 BA 与图优化245
      • 10.2.1 投影模型和BA 代价函数 245
      • 10.2.2 BA 的求解247
      • 10.2.3 稀疏性和边缘化248
      • 10.2.4 鲁棒核函数255
      • 10.2.5 小结256
      • 10.3 实践:g2o257
      • 10.3.1 BA 数据集257
      • 10.3.2 g2o 求解BA258
      • 10.3.3 求解262
      • 10.4 实践:Ceres 264
      • 10.4.1 Ceres 求解BA 265
      • 10.4.2 求解267
      • 10.5 小结269
      • 第11 讲后端2 270
      • 11.1 位姿图(Pose Graph)271
      • 11.1.1 Pose Graph 的意义271
      • 11.1.2 Pose Graph 的优化272
      • 11.2 实践:位姿图优化274
      • 11.2.1 g2o 原生位姿图 274
      • 11.2.2 李代数上的位姿图优化278
      • 11.2.3 小结284
      • 11.3 * 因子图优化初步285
      • 11.3.1 贝叶斯网络285
      • 11.3.2 因子图286
      • 11.3.3 增量特性288
      • 11.4 * 实践:gtsam 289
      • 11.4.1 安装gtsam 4.0289
      • 11.4.2 位姿图优化290
      • 第12 讲回环检测297
      • 12.1 回环检测概述299
      • 12.1.1 回环检测的意义299
      • 12.1.2 方法 300
      • 12.1.3 准确率和召回率301
      • 12.2 词袋模型303
      • 12.3 字典 305
      • 12.3.1 字典的结构305
      • 12.3.2 实践:创建字典306
      • 12.4 相似度计算309
      • 12.4.1 理论部分309
      • 12.4.2 实践:相似度的计算310
      • 12.5 实验分析与评述314
      • 12.5.1 增加字典规模314
      • 12.5.2 相似性评分的处理316
      • 12.5.3 关键帧的处理316
      • 12.5.4 检测之后的验证317
      • 12.5.5 与机器学习的关系317
      • 第13 讲建图319
      • 13.1 概述320
      • 13.2 单目稠密重建322
      • 13.2.1 立体视觉322
      • 13.2.2 极线搜索与块匹配323
      • 13.2.3 高斯分布的深度滤波器325
      • 13.3 实践:单目稠密重建328
      • 13.4 实验分析与讨论339
      • 13.4.1 像素梯度的问题339
      • 13.4.2 逆深度340
      • 13.4.3 图像间的变换 341
      • 13.4.4 并行化:效率的问题342
      • 13.4.5 其他的改进343
      • 13.5 RGB-D 稠密建图343
      • 13.5.1 实践:点云地图344
      • 13.5.2 八叉树地图347
      • 13.5.3 实践:八叉树地图350
      • 13.6 *TSDF 地图和Fusion 系列352
      • 13.7 小结356
      • 第14 讲SLAM:现在与未来357
      • 14.1 当前的开源方案358
      • 14.1.1 MonoSLAM358
      • 14.1.2 PTAM359
      • 14.1.3 ORB-SLAM361
      • 14.1.4 LSD-SLAM363
      • 14.1.5 SVO 364
      • 14.1.6 RTAB-MAP366
      • 14.1.7 其他367
      • 14.2 未来的SLAM 话题367
      • 14.2.1 视觉+ 惯性导航SLAM367
      • 14.2.2 语义SLAM369
      • 14.2.3 SLAM 的未来 370
      • 附录A 高斯分布的性质371
      • A.1 高斯分布371
      • A.2 高斯分布的运算371
      • A.2.1 线性运算371
      • A.2.2 乘积372
      • A.2.3 复合运算372
      • A.3 复合的例子372
      • 附录B ROS 入门374
      • B.1 ROS 是什么374
      • B.2 ROS 的特点375
      • B.3 如何快速上手ROS375
      • 参考文献377

      学习笔记

      详解Python计算机视觉 图像扭曲(仿射扭曲)

      对图像块应用仿射变换,我们将其称为图像扭曲(或者仿射扭曲)。该操作不仅经常应用在计算机图形学中,而且经常出现在计算机视觉算法中。 一、仿射变换原理 仿射变换能够保持图像的“平直性”,包括旋转,缩放,平移,错切操作。对于三个点,仿射变换可以将一副图像进行扭曲,使得三对对应点对可以完美地匹配上。仿射变换具有6个自由度,有三个对应点对可以给出6个约束条件(对于这三个对应点对,x和y坐标必须都要匹配) 仿射变换是在几何上定义为两个向量空间之间的一个仿射变换或者仿射映射。由一个非奇异的线性变换(运用一次函数进行的变换)接上一个平移变换组成。在有限维的情……

      [机器视觉]使用python自动识别验证码详解

      前言 CAPTCHA全称Completely Automated Public Turing Test to Tell Computers and Humans Apart,即全自动区分人机的图灵测试。这也是验证码诞生的主要任务。但是随着近年来大数据运算和机器视觉的发展,用机器视觉识别图像已经变得非常容易,过去用于区分人机的验证码也开始变得不再安全。 接下来就让我们从零开始,深入图像处理和算法构建,来看看使用机器视觉来识别过时的验证码( 如下所示 )究竟可以有多简单。 载入需要的程序包 nbsp;图像预处理 capt_process()方法会先将验证码转为灰度图,然后再根据全局变量中定义的LUT将灰度图转化为黑白图片。并按照验证码中四个字符所在的位置进行切割。 从彩色图片到灰……

      Egret引擎开发指南之视觉编程

      显示对象和显示列表 “显示对象”,准确的含义是可以在舞台上显示的对象。可以显示的对象,既包括可以直接看见的图形、文字、视频、图片等,也包括不能看见但真实存在的显示对象容器。 在Egret中,视觉图形都是由显示对象和显示对象容器组成的。 如果我们要表达上图中的场景,我们应该如何通过树的方式来描述呢? 显示对象等级结构 在Egret中,显示对象被分为两大类:一种是可以包括其他显示对象的显示对象容器,简称为“容器”。另外一种是单纯的显示对象,除自身以外不能包括其他显示对象,简称“非容器对象”。 在实际的操作中,我们可以把这样一种结构看成一个树状结构,容器可……

      视觉直观感受若干常用排序算法

      直观感受几种常用排序算法,具体内容如下 1 快速排序 介绍: 快速排序是由东尼·霍尔所发展的一种排序算法。在平均状况下,排序 n 个项目要Ο(n log n)次比较。在最坏状况下则需要Ο(n2)次比较,但这种状况并不常见。事实上,快速排序通常明显比其他Ο(n log n) 算法更快,因为它的内部循环(inner loop)可以在大部分的架构上很有效率地被实现出来,且在大部分真实世界的数据,可以决定设计的选择,减少所需时间的二次方项之可能性。 步骤: 从数列中挑出一个元素,称为 "基准"(pivot), 重新排序数列,所有元素比基准值小的摆放在基准前面,所有元素比基准值大的摆在基准的后面(相同的数可以到……

      以上就是本次介绍的视觉SLAM电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:手把手教你学FPGA设计:基于大道至简的至简设计法

      下一篇:编程之法:面试和算法心得

      展开 +

      收起 -

      下载地址:百度网盘下载
      视觉SLAM相关电子书
      数字图像处理与机器视觉:Visual C++与Matlab实现
      数字图像处理与机器视觉:Visual C++与Matlab实现 全书扫描第2版

      本书将理论知识、科学研究和工程实践有机结合起来,内容涉及数字图像处理和识别技术的方方面面,结构紧凑,内容深入浅出,讲解图文并茂,感兴趣的可以下载学习

      立即下载
      MATLAB计算机视觉与深度学习实战
      MATLAB计算机视觉与深度学习实战 超清版 立即下载
      数字图像处理与机器视觉:Visual C++与Matlab实现
      数字图像处理与机器视觉:Visual C++与Matlab实现 清晰扫描第2版

      本书将理论知识、科学研究和工程实践有机结合起来,内容涉及数字图像处理和识别技术的方方面面,结构紧凑,内容深入浅出,讲解图文并茂,感兴趣的可以下载学习

      立即下载
      计算机视觉增强现实应用程序开发
      计算机视觉增强现实应用程序开发 全书扫描版

      本书的内容主要包括Unity3D编程基础,Unity核心组件介绍,常用插件和第三方SDK的使用简介及相关的演示项目,项目都有详细的代码和功能介绍,均循序渐进地讲解需要使用的工具的基本原理和

      立即下载
      计算机视觉算法与智能车应用
      计算机视觉算法与智能车应用 超清原版

      现阶段实际上运用中只根据计算机视觉处理别的控制器急需解决的科学研究和工程问题,如行车道线检验、终止线检验、交通信号灯鉴别等。随之智能车产业发展系统进程的即将来临,因为智

      立即下载
      深度学习之PyTorch实战计算机视觉
      深度学习之PyTorch实战计算机视觉 高清影印版

      计算机视觉、自然语言处理和语音识别是目前深度学习领域很热门的三大应用方向,本书旨在帮助零基础或基础较为薄弱的读者入门深度学习,达到能够独立使用深度学习知识处理计算机视觉问

      立即下载
      深度学习与计算机视觉:算法原理 框架应用与代码实现
      深度学习与计算机视觉:算法原理 框架应用与代码实现 完整扫描版

      《深度学习与计算机视觉:算法原理、框架应用与代码实现》 全面介绍了深度学习及计算机视觉中基础的知识,并结合常见的应用场景和大量实例,带领读者进入丰富多彩的计算机视觉领域。

      立即下载
      形式感+网页视觉设计创意拓展与快速表现
      形式感+网页视觉设计创意拓展与快速表现 影印版 立即下载
      视觉机器学习20讲
      视觉机器学习20讲 附源码版

      本书是在机器学习领域12位博士多年研究机器学习的基础理论、核心算法、关键技术和应用实践的科学结晶,是作者们多年相关科研实践的心得体会和系统总结。

      立即下载
      计算机视觉:模型、学习和推理
      计算机视觉:模型、学习和推理 全书影印版

      本书是一本从机器学习视角讲解计算机视觉的非常好的教材。全书图文并茂、语言浅显易懂,算法描述由浅入深,即使是数学背景不强的学生也能轻松理解和掌握

      立即下载
      读者留言
      码农之家

      码农之家 提供上传

      资源
      20
      粉丝
      7
      喜欢
      100
      评论
      13

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com