深度学习之图像识别:核心技术与案例实战

  • 更新时间:
  • 3002人关注
  • 免费获取

深度学习之图像识别:核心技术与案例实战》是一本关于深度学习相关的计算机书籍,介绍了关于深度学习、图像识别方面的内容,本书是由机械工业出版社出版,言有三编写,目前豆瓣、亚马逊、当当、京东等综合评分为:8.1分,一起来看下具体内容。

资源详情相关推荐
《深度学习之图像识别:核心技术与案例实战》封面
  • 出版社:机械工业出版社
  • 作者:言有三
  • 大小:10031 MB M
  • 类别:深度学习
  • 热度:838
  • 深度学习入门之PyTorch
  • 神经网络与深度学习应用实战
  • OpenCV和Visual Studio图像识别应用开发
  • 深度学习之TensorFlow入门、原理与进阶实战
  • Keras图像深度学习实战
  • 书籍介绍

    这书全方位详细介绍了深度神经网络在图象处理行业中的关键技术与运用。书中不仅高度重视基础知识的解读,并且从第4章刚开始的各章都出示了一到2个不一样难度系数的实例供阅读者实践活动,阅读者能够 在现有编码的基本上开展改动和改善,进而加重对所教专业知识的了解。

    这书共10章,最先从深度神经网络的基本定义刚开始,详细介绍了神经元网络的基本知识和深度神经网络中的提升技术;随后系统化详细介绍了深度神经网络中与数据信息有关的专业知识,包含經典uci数据集的设计方案、uci数据集的提高及其数据信息的获得与梳理;然后重中之重对于图象开发行业,用3章內容系统化详细介绍了深度神经网络在图象归类、图像分割和总体目标检验3个行业的关键技术与运用,这种內容的解读均融合实战演练实例进行;此外,还对深度神经网络中损失函数的发展趋势、数据信息和实体模型的数据可视化及其实体模型的缩小和提升开展了详解,为阅读者设计方案和训炼更为好用的实体模型出示了具体指导;*后以小程序服务平台为借助,详细介绍了小程序前后左右端开发技术,进行了深度神经网络的实体模型布署,让这书的內容产生了一个详细的闭环控制。

    这书理论研究融合,深层与深度广度兼顾,非常合适深度神经网络行业的有关技术工作人员与发烧友阅读文章,特别是在合适根据深度神经网络的图象从业者阅读文章,以多方位掌握深度神经网络在图象行业中的技术全景。此外,这书还合适做为有关培训学校的深度神经网络教材内容应用。

    目录

    • 前言
    • 第1章 神经网络基础1
    • 1.1 神经网络的生物基础与数学模型1
    • 1.1.1 神经元1
    • 1.1.2 感知机2
    • 1.1.3 BP算法6
    • 1.2 卷积神经网络基础10
    • 1.2.1 卷积神经网络的基本结构11
    • 1.2.2 卷积与权值共享13
    • 1.2.3 感受野与池化14
    • 第2章 深度学习优化基础17
    • 2.1 深度学习主流开源框架17
    • 2.1.1 Caffe简介18
    • 2.1.2 TensorFlow简介18
    • 2.1.3 PyTorch简介19
    • 2.1.4 Theano简介20
    • 2.1.5 Keras简介20
    • 2.1.6 MXNet简介21
    • 2.1.7 Chainer简介21
    • 2.2 网络优化参数22
    • 2.2.1 常用激活函数22
    • 2.2.2 参数初始化方法26
    • 2.2.3 最优化方法27
    • 2.2.4 归一化方法31
    • 2.2.5 正则化方法33
    • 第3章 深度学习中的数据36
    • 3.1 深度学习通用数据集的发展36
    • 3.1.1 MNIST数据集36
    • 3.1.2 CIFAR10和CIFAR100数据集37
    • 3.1.3 PASCAL数据集38
    • 3.1.4 ImageNet数据集38
    • 3.1.5 Microsoft COCO数据集39
    • 3.2 常见的计算机视觉任务数据集40
    • 3.2.1 人脸数据集40
    • 3.2.2 自动驾驶数据集52
    • 3.2.3 医学数据集55
    • 3.3 数据增强59
    • 3.3.1 有监督数据增强60
    • 3.3.2 无监督数据增强63
    • 3.4 数据的收集与标注65
    • 3.4.1 数据收集65
    • 3.4.2 数据标注67
    • 3.4.3 数据清洗与整理68
    • 第4章 图像分类70
    • 4.1 图像分类基础70
    • 4.1.1 图像分类问题70
    • 4.1.2 深度学习图像分类发展简史72
    • 4.1.3 评测指标与优化目标75
    • 4.1.4 图像分类的挑战76
    • 4.2 移动端实时表情分类实战77
    • 4.2.1 项目背景78
    • 4.2.2 数据预处理80
    • 4.2.3 项目方案82
    • 4.2.4 模型训练与测试84
    • 4.2.5 项目总结88
    • 4.3 细粒度图像分类实战89
    • 4.3.1 项目背景89
    • 4.3.2 项目方案90
    • 4.3.3 模型训练与测试92
    • 4.3.4 参数调试97
    • 4.3.5 项目总结102
    • 第5章 图像分割103
    • 5.1 传统图像分割方法103
    • 5.1.1 阈值法103
    • 5.1.2 区域生长法与超像素105
    • 5.1.3 图切割105
    • 5.1.4 活动轮廓模型106
    • 5.2 深度学习图像分割109
    • 5.2.1 基本流程110
    • 5.2.2 反卷积110
    • 5.2.3 多尺度与感受野112
    • 5.2.4 CRF方法113
    • 5.2.5 Image Matting与图像融合114
    • 5.3 移动端实时图像分割项目115
    • 5.3.1 项目背景115
    • 5.3.2 项目方案116
    • 5.3.3 模型训练与总结126
    • 5.4 一个实时肖像换背景项目127
    • 5.4.1 项目背景127
    • 5.4.2 项目方案128
    • 5.4.3 模型训练与测试134
    • 5.4.4 项目总结138
    • 第6章 目标检测139
    • 6.1 目标检测基础139
    • 6.1.1 检测窗口选择140
    • 6.1.2 特征提取141
    • 6.1.3 分类器142
    • 6.1.4 V-J人脸检测算法143
    • 6.2 深度学习目标检测方法145
    • 6.2.1 Selective search与R-CNN146
    • 6.2.2 RoI Pooling与SPPNet147
    • 6.2.3 Fast R-CNN与Faster R-CNN149
    • 6.2.4 YOLO方法152
    • 6.2.5 SSD方法154
    • 6.2.6 目标检测中的关键技术155
    • 6.3 实战Faster-R-CNN目标检测157
    • 6.3.1 项目背景157
    • 6.3.2 py-faster-rcnn框架解读157
    • 6.3.3 模型定义与分析170
    • 6.3.4 模型训练与测试180
    • 6.3.5 项目总结183
    • 第7章 数据与模型可视化185
    • 7.1 数据可视化185
    • 7.1.1 低维数据可视化185
    • 7.1.2 高维数据可视化187
    • 7.2 模型可视化190
    • 7.2.1 模型结构可视化190
    • 7.2.2 模型权重可视化198
    • 7.2.3 特征图可视化201
    • 7.3 可视化案例202
    • 7.3.1 项目背景202
    • 7.3.2 数据接口定义204
    • 7.3.3 网络结构定义205
    • 7.3.4 可视化代码添加207
    • 7.3.5 可视化训练指标207
    • 第8章 模型压缩209
    • 8.1 模型压缩方法209
    • 8.1.1 模型设计压缩210
    • 8.1.2 网络剪枝与量化213
    • 8.1.3 张量分解216
    • 8.1.4 模型蒸馏与迁移学习216
    • 8.2 模型压缩实战218
    • 8.2.1 网络分析220
    • 8.2.2 输入尺度和第一层卷积设计224
    • 8.2.3 网络宽度与深度压缩226
    • 8.2.4 弥补通道损失228
    • 8.2.5 总结230
    • 第9章 损失函数231
    • 9.1 分类任务损失231
    • 9.1.1 什么是0-1 loss231
    • 9.1.2 熵与交叉熵loss231
    • 9.1.3 softmax loss及其变种232
    • 9.1.4 KL散度237
    • 9.1.5 Hinge loss简介237
    • 9.1.6 Exponential loss与Logistic loss237
    • 9.1.7 多标签分类任务loss238
    • 9.2 回归任务损失238
    • 9.2.1 L1 loss与L2 loss238
    • 9.2.2 L1 loss与L2 loss的改进239
    • 9.3 常见图像任务与loss使用240
    • 9.3.1 图像基础任务240
    • 9.3.2 风格化与图像复原,超分辨重建240
    • 9.3.3 生成对抗网络241
    • 9.3.4 总结245
    • 第10章 模型部署与上线246
    • 10.1 微信小程序前端开发246
    • 10.1.1 小程序的技术特点与定位246
    • 10.1.2 Web前端基础248
    • 10.1.3 小程序开发工具251
    • 10.1.4 小程序前端目录252
    • 10.1.5 小程序前端开发254
    • 10.2 微信小程序服务端开发260
    • 10.2.1 域名注册与管理260
    • 10.2.2 服务端框架简介261
    • 10.2.3 算法搭建与实现262
    • 10.3 Caffe环境配置264
    • 10.3.1 依赖库安装264
    • 10.3.2 Caffe编译安装266

    相关声明:

    深度学习之图像识别:核心技术与案例实战 由用户 阙晓燕 于 2020-02-01 10:33:14 整理编辑,版权归机械工业出版社所有。仅供想学习深度学习的网友交流使用,专题参考:深度学习,

    深度学习书籍

    • 深度学习核心技术与实践

      深度学习核心技术与实践

      本书介绍了深度学习的核心算法,以及在计算机视觉、语音识别、自然语言处理中的相关应用,讲解原理,较少贴代码。本书适合深度学习从业人士或者相关研究生作为参考资料

      大小:207 MB深度学习

      立即下载
    • 深度学习:智能时代的核心驱动力量

      深度学习:智能时代的核心驱动力量

      全球科技巨头纷纷拥抱深度学习,自动驾驶、AI医疗、语音识别、图像识别、智能翻译以及震惊世界的AlphaGo,背后都是深度学习在发挥神奇的作用。深度学习是人工智能从概念到繁荣得以实现的主流技术。经过深度学习训练的计算机,不再被动按照指令运转,而是像自然进化的生命那样,开始自主地从经验中学习。

      大小:15.9 MB人工智能

      立即下载
    • 深度学习:Keras快速开发入门

      深度学习:Keras快速开发入门

      帮助读者快速掌握一款深度学习框架,从而解决工作和学习当中神经网络模型的使用问题。同时,《深度学习:Keras快速开发入门》还介绍了如何用Keras快速构建深度学习原型并着手实战

      大小:76.8 MBKeras

      立即下载
    • 白话深度学习与TensorFlow

      白话深度学习与TensorFlow

      大小:35.7 MBTensorFlow

      立即下载
    • 图解深度学习与神经网络

      图解深度学习与神经网络

      本书是以TensorFlow 为工具介绍神经网络和深度学习的入门书,内容循序渐进,以简单示例和图例的形式,展示神经网络和深度学习背后的数学基础原理,帮助读者更好地理解复杂抽象的公式。

      大小:174.5 MBTensorFlow

      立即下载
    • PyTorch深度学习实战

      PyTorch深度学习实战

      这本书从原理到实战、深入浅出地介绍了Facebook人工智能利器Pytorch的卓越表现,主要定位为具有一定Python编程基础,对机器学习和神经网络有一定了解的程序员们

      大小:8.7 MBPyTorch

      立即下载
    • 深度学习原理与实践

      深度学习原理与实践

      《深度学习原理与实践》 详细介绍了目前深度学习相关的常用网络模型(ANN、CNN、RNN),以及不同网络模型的算法原理和核心思想。本书利用大量的实例代码对网络模型进行了分析,这些案例

      大小:172.9 MB深度学习

      立即下载
    • 深度学习:从入门到实战

      深度学习:从入门到实战

      本书从12个落地实践角度精炼阐述深度学习方法论解析与核心技术;22个经典案例融入11个综合案例,全面构建深度学习实践框架,切实提升开发技能,积累开发经验

      大小:183.5 MB深度学习

      立即下载

    读书笔记

    3小时28分钟前回答

    python自动截取需要区域,进行图像识别的方法

    实例如下所示: import osos.chdir("G:\Python1\Lib\site-packages\pytesser")from pytesser import *from pytesseract import image_to_stringfrom PIL import Imagefrom PIL import ImageGrab#截图,获取需要识别的区域x = 345y = 281m = 462n = 327k = 54for i in range(2,6): box = (x,y,m,n) img = ImageGrab.grab(box) img.save("G:\Python1\Lib\site-packages\pytesser\kangkang"+str(i)+".png") #img.show() y+=54 n+=54#截图完毕后,开始图像识别names=["kangkang2.png","kangkang3.png","kangkang4.png","kangkang5.png"]for name in names: im = Image.open(name) text = image_to_string(im) print(name+":"+text) 以上这篇python自动截取需要区域,进行图像识别的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持码农之家……

    13小时31分钟前回答

    Java OCR tesseract 图像智能文字字符识别技术实例代码

    接着上一篇OCR所说的,上一篇给大家介绍了tesseract 在命令行的简单用法,当然了要继承到我们的程序中,还是需要代码实现的,下面给大家分享下Java实现的例子。 拿代码扫描上面的图片,然后输出结果。主要思想就是利用Java调用系统任务。 下面是核心代码: package com.zhy.test; import java.io.BufferedReader; import java.io.File; import java.io.FileInputStream; import java.io.InputStreamReader; import java.util.ArrayList; import java.util.List; import org.jdesktop.swingx.util.OS; public class OCRHelper { private final String LANG_OPTION = "-l"; private final String EOL = System.getProperty("line.separator"); /** * 文件位置我防止在,项目同一路径 */ private String tessPath = new File("tesser……

    24小时48分钟前回答

    python实现图像识别功能

    本文实例为大家分享了python实现图像识别的具体代码,供大家参考,具体内容如下 #! /usr/bin/env python from PIL import Image import pytesseract url='img/denggao.jpeg' image=Image.open(url) #image=image.convert('RGB') # RGB image=image.convert('L') # 灰度 image.load() text=pytesseract.image_to_string(image) print text #image.show() r'''''# zhongwen_url = 'img/zhongwen003.png' import os fn = "aaaa" # sudo apt-get install tesseract cmd = "tesseract " + zhongwen_url + " " + fn + " -l chi_sim" os.system(cmd) with open(fn+".txt", "r") as f: print f ret=os.system('cat /etc/pam.conf') print ret print '----------------------' ret=os.popen('cat /etc/pam.conf') print ret''' r''''' import os import subprocess def image_to_string(img, cleanup=True, plus=''): # cleanup为T……

    16小时20分钟前回答

    Python构建图像分类识别器的方法

    机器学习用在图像识别是非常有趣的话题。 我们可以利用OpenCV强大的功能结合机器学习算法实现图像识别系统。 首先,输入若干图像,加入分类标记。利用向量量化方法将特征点进行聚类,并得出中心点,这些中心点就是视觉码本的元素。 其次,利用图像分类器将图像分到已知的类别中,ERF(极端随机森林)算法非常流行,因为ERF具有较快的速度和比较精确的准确度。我们利用决策树进行正确决策。 最后,利用训练好的ERF模型后,创建目标识别器,可以识别未知图像的内容。 当然,这只是雏形,存在很多问题: 界面不友好。 准确率如何保证,如何调整超参数,只有认真研究算法机理,才能真正清……

    6小时9分钟前回答

    python识别图像并提取文字的实现方法

    前言 python图像识别一般基础到的就是tesseract了,在爬虫中处理验证码广泛使用。 安装 安装教程网上大都差不多,Windows下确实比较麻烦,涉及到各种路径、环境变量甚至与linux不同的路径分隔符,所以这里的安装是基于Centos7。 1. 依赖安装 yum install -y automake autoconf libtool gcc gcc-c++ 2. 安装leptonica Leptonica主要用于图像处理和图像分析 原则上所有的库文件都是可以直接用yum安装的,如果想要具体的某个版本,可以前往官方源下载对应版本然后按照对应方式编译 wget http://www.leptonica.org/source/leptonica-1.74.4.tar.gztar -zxvf leptonica-1.74.4.tar.gzcd leptonica-1.74.4/./configuremake make install 3. 安装tesseract 其他各版本可以在这里下载……