计算机视觉与深度学习实战 以MATLAB、Python为工具
作者:刘衍琦
出版时间: 2019年版
内容简介
本书详细讲解了36个计算机视觉与深度学习实战案例(含可运行程序),涉及雾霾去噪、答题卡自动阅卷、肺部图像分割、小波数字水印、图像检索、人脸二维码识别、车牌定位及识别、霍夫曼图像压缩、手写数字识别、英文字符文本识别、眼前节组织提取、全景图像拼接、小波图像融合、基于语音识别的音频信号模拟灯控、路面裂缝检测识别、视频运动估计追踪、Simulink图像处理、胸片及肝脏分割、基于深度学习的汽车目标检测、基于计算机视觉的自动驾驶应用、基于深度学习的视觉场景识别、基于深度特征的以图搜画、基于CNN的字符识别、基于CNN的物体识别、基于CNN的图像矫正、基于LSTM的时间序列分析、基于深度学习的以图搜图技术、基于YOLO的智能交通目标检测等多项重要技术及应用,涵盖了数字图像处理中几乎所有的基本模块,并延伸到了深度学习理论及其应用方面。工欲善其事,必先利其器,本书对每个数字图像处理的知识点都提供了丰富、生动的案例素材,并以MATLAB、Python为工具详细讲解了实验的核心程序。通过对这些程序的阅读、理解和仿真运行,读者可以更加深刻地理解图像处理的内容,并且更加熟练地掌握计算机视觉及深度学习在不同实际领域中的用法。 \n本书以案例为基础,结构布局紧凑,内容深入浅出,实验简捷高效,适合计算机、信号通信和自动化等相关专业的教师、本科生、研究生,以及广大从事数字图像处理的工程研发人员阅读参考。 \n
目录
第1章基于直方图优化的图像去雾技术1
\n
1.1案例背景1
\n
1.2理论基础1
\n
1.2.1空域图像增强1
\n
1.2.2直方图均衡化2
\n
1.3程序实现3
\n
1.3.1设计GUI界面4
\n
1.3.2全局直方图处理4
\n
1.3.3局部直方图处理6
\n
1.3.4Retinex增强处理8
\n
1.4延伸阅读12
\n
\n
第2章基于形态学的权重自适应图像去噪13
\n
2.1案例背景13
\n
2.2理论基础14
\n
2.2.1图像去噪的方法14
\n
2.2.2数学形态学的原理15
\n
2.2.3权重自适应的多结构形态学去噪15
\n
2.3程序实现16
\n
2.4延伸阅读22
\n
\n
第3章基于多尺度形态学提取眼前节组织24
\n
3.1案例背景24
\n
3.2理论基础25
\n
3.3程序实现28
\n
3.3.1多尺度结构设计28
\n
3.3.2多尺度边缘提取29
\n
3.3.3多尺度边缘融合31
\n
3.4延伸阅读33
\n
\n
第4章基于Hough变化的答题卡识别34
\n
4.1案例背景34
\n
4.2理论基础34
\n
4.2.1图像二值化35
\n
4.2.2倾斜校正35
\n
4.2.3图像分割38
\n
4.3程序实现40
\n
4.3.1图像灰度化40
\n
4.3.2灰度图像二值化41
\n
4.3.3图像平滑滤波41
\n
4.3.4图像矫正41
\n
4.3.5完整性核查42
\n
4.4延伸阅读51
\n
\n
第5章基于阈值分割的车牌定位识别53
\n
5.1案例背景53
\n
5.2理论基础53
\n
5.2.1车牌图像处理54
\n
5.2.2车牌定位原理58
\n
5.2.3车牌字符处理58
\n
5.2.4车牌字符识别60
\n
5.3程序实现62
\n
5.4延伸阅读69
\n
\n
第6章基于分水岭分割进行肺癌诊断71
\n
6.1案例背景71
\n
6.2理论基础71
\n
6.2.1模拟浸水的过程72
\n
6.2.2模拟降水的过程72
\n
6.2.3过度分割问题72
\n
6.2.4标记分水岭分割算法72
\n
6.3程序实现73
\n
6.4延伸阅读77
\n
\n
第7章基于主成分分析的人脸二维码识别79
\n
7.1案例背景79
\n
7.2理论基础79
\n
7.2.1QR二维码简介80
\n
7.2.2QR二维码的编码和译码流程82
\n
7.2.3主成分分析方法84
\n
7.3程序实现85
\n
7.3.1人脸建库85
\n
7.3.2人脸识别87
\n
7.3.3人脸二维码87
\n
7.4延伸阅读92
\n
\n
第8章基于知识库的手写体数字识别94
\n
8.1案例背景94
\n
8.2理论基础94
\n
8.2.1算法流程94
\n
8.2.2特征提取95
\n
8.2.3模式识别96
\n
8.3程序实现97
\n
8.3.1图像处理97
\n
8.3.2特征提取98
\n
8.3.3模式识别101
\n
8.4延伸阅读102
\n
8.4.1识别器选择102
\n
8.4.2特征库改善102
\n
\n
第9章基于特征匹配的英文印刷字符识别103
\n
9.1案例背景103
\n
9.2理论基础104
\n
9.2.1图像预处理104
\n
9.2.2图像识别技术105
\n
9.3程序实现106
\n
9.3.1界面设计106
\n
9.3.2回调识别111
\n
9.4延伸阅读112
\n
\n
第10章基于不变矩的数字验证码识别113
\n
10.1案例背景113
\n
10.2理论基础114
\n
10.3程序实现114
\n
10.3.1设计GUI界面114
\n
10.3.2载入验证码图像115
\n
10.3.3验证码图像去噪116
\n
10.3.4验证码数字定位118
\n
10.3.5验证码归一化120
\n
10.3.6验证码数字识别121
\n
10.3.7手动确认并入库124
\n
10.3.8重新生成模板库125
\n
10.4延伸阅读128
\n
\n
第11章基于小波技术进行图像融合129
\n
11.1案例背景129
\n
11.2理论基础130
\n
11.3程序实现132
\n
11.3.1设计GUI界面132
\n
11.3.2图像载入133
\n
11.3.3小波融合135
\n
11.4延伸阅读137
\n
\n
第12章基于块匹配的全景图像拼接138
\n
12.1案例背景138
\n
12.2理论基础138
\n
12.2.1图像匹配139
\n
12.2.2图像融合141
\n
12.3程序实现142
\n
12.3.1设计GUI界面142
\n
12.3.2载入图片143
\n
12.3.3图像匹配144
\n
12.3.4图像拼接148
\n
12.4延伸阅读153
\n
\n
第13章基于霍夫曼图像编码的图像压缩和重建155
\n
13.1案例背景155
\n
13.2理论基础155
\n
13.2.1霍夫曼编码的步骤156
\n
13.2.2霍夫曼编码的特点157
\n
13.3程序实现158
\n
13.3.1设计GUI界面158
\n
13.3.2压缩和重建159
\n
13.3.3效果对比164
\n
13.4延伸阅读167
\n
\n
第14章基于主成分分析的图像压缩和重建168
\n
14.1案例背景168
\n
14.2理论基础168
\n
14.2.1主成分降维分析原理168
\n
14.2.2由得分矩阵重建样本169
\n
14.2.3主成分分析数据压缩比170
\n
14.2.4基于主成分分析的图像压缩170
\n
14.3程序实现171
\n
14.3.1主成分分析的源代码171
\n
14.3.2图像数组和样本矩阵之间的转换172
\n
14.3.3基于主成分分析的图像压缩173
\n
14.4延伸阅读176
\n
\n
第15章基于小波的图像压缩技术177
\n
15.1案例背景177
\n
15.2理论基础178
\n
15.3程序实现180
\n
15.4延伸阅读188
\n
\n
第16章基于融合特征的以图搜图技术189
\n
16.1案例背景189
\n
16.2理论基础189
\n
16.3程序实现191
\n
16.3.1图像预处理191
\n
16.3.2计算特征191
\n
16.3.3图像检索194
\n
16.3.4结果分析194
\n
16.4延伸阅读196
\n
\n
第17章基于Harris的角点特征检测198
\n
17.1案例背景198
\n
17.2理论基础199
\n
17.2.1Harris的基本原理199
\n
17.2.2Harris算法的流程201
\n
17.2.3Harris角点的性质201
\n
17.3程序实现202
\n
17.3.1Harris算法的代码202
\n
17.3.2角点检测实例204
\n
17.4延伸阅读205
\n
\n
第18章基于GUI搭建通用视频处理工具206
\n
18.1案例背景206
\n
18.2理论基础206
\n
18.3程序实现208
\n
18.3.1设计GUI界面208
\n
18.3.2实现GUI界面209
\n
18.4延伸阅读220
\n
\n
第19章基于语音识别的信号灯图像
\n
模拟控制技术221
\n
19.1案例背景221
\n
19.2理论基础221
\n
19.3程序实现223
\n
19.4延伸阅读232
\n
\n
第20章基于帧间差法进行视频目标检测234
\n
20.1案例背景234
\n
20.2理论基础234
\n
20.2.1帧间差分法235
\n
20.2.2背景差分法236
\n
20.2.3光流法236
\n
20.3程序实现237
\n
20.4延伸阅读24
\n
\n
第21章路面裂缝检测系统设计247
\n
21.1案例背景247
\n
21.2理论基础247
\n
21.2.1图像灰度化248
\n
21.2.2图像滤波250
\n
21.2.3图像增强252
\n
21.2.4图像二值化253
\n
21.3程序实现255
\n
21.4延伸阅读267
\n
\n
第22章基于K-means聚类算法的图像分割268
\n
22.1案例背景268
\n
22.2理论基础268
\n
22.2.1K-means聚类算法的原理268
\n
22.2.2K-means聚类算法的要点269
\n
22.2.3K-means聚类算法的缺点270
\n
22.2.4基于K-means聚类算法进行图像分割270
\n
22.3程序实现271
\n
22.3.1样本间的距离271
\n
22.3.2提取特征向量272
\n
22.3.3图像聚类分割273
\n
22.4延伸阅读275
\n
\n
第23章基于光流场的车流量计数应用276
\n
23.1案例背景276
\n
23.2理论基础276
\n
23.2.1基于光流法检测运动的原理276
\n
23.2.2光流场的主要计算方法277
\n
23.2.3梯度光流场约束方程278
\n
23.2.4Horn-Schunck光流算法280
\n
23.3程序实现281
\n
23.3.1计算视觉系统工具箱简介281
\n
23.3.2基于光流法检测汽车运动282
\n
23.4延伸阅读287
\n
\n
第24章基于Simulink进行图像和视频处理289
\n
24.1案例背景289
\n
24.2模块介绍289
\n
24.2.1分析和增强模块库(Analysis和Enhancement)290
\n
24.2.2转化模块库(Conversions)291
\n
24.2.3滤波模块库(Filtering)292
\n
24.2.4几何变换模块库(GeometricTransformations)292
\n
24.2.5形态学操作模块库(MorphologicalOperations)292
\n
24.2.6输入模块库(Sources)293
\n
24.2.7输出模块库(Sinks)293
\n
24.2.8统计模块库(Statistics)294
\n
24.2.9文本和图形模块库(Text和Graphic)295
\n
24.2.10变换模块库(Transforms)295
\n
24.2.11其他工具模块库(Utilities)295
\n
24.3仿真案例296
\n
24.3.1搭建组织模型296
\n
24.3.2仿真执行模型298
\n
24.3.3自动生成报告299
\n
24.4延伸阅读302
\n
\n
第25章基于小波变换的数字水印技术304
\n
25.1案例背景304
\n
25.2理论基础304
\n
25.2.1数字水印技术的原理305
\n
25.2.2典型的数字水印算法307
\n
25.2.3数字水印攻击和评价309
\n
25.2.4基于小波的水印技术310
\n
25.3程序实现312
\n
25.3.1准备载体和水印图像312
\n
25.3.2小波数字水印的嵌入313
\n
25.3.3小波数字水印的提取317
\n
25.3.4小波水印的攻击试验319
\n
25.4延伸阅读323
\n
\n
第26章基于最小误差法的胸片分割技术325
\n
26.1案例背景325
\n
26.2理论基础325
\n
26.2.1图像增强326
\n
26.2.2区域选择326
\n
26.2.3形态学滤波327
\n
26.2.4基于最小误差法进行胸片分割328
\n
26.3程序实现329
\n
26.3.1设计GUI界面329
\n
26.3.2图像预处理330
\n
26.3.3基于最小误差法进行图像分割333
\n
26.3.4形态学后处理335
\n
26.4延伸阅读338
\n
\n
第27章基于区域生长的肝脏影像分割系统339
\n
27.1案例背景339
\n
27.2理论基础340
\n
27.2.1阈值分割340
\n
27.2.2区域生长340
\n
27.2.3基于阈值预分割的区域生长341
\n
27.3程序实现342
\n
27.4延伸阅读346
\n
\n
第28章基于计算机视觉的自动驾驶应用347
\n
28.1案例背景347
\n
28.2理论基础348
\n
28.2.1环境感知348
\n
28.2.2行为决策348
\n
28.2.3路径规划349
\n
28.2.4运动控制349
\n
28.3程序实现349
\n
28.3.1传感器数据载入349
\n
28.3.2追踪器创建351
\n
28.3.3碰撞预警353
\n
28.4延伸阅读358
\n
\n
第29章基于深度学习的汽车目标检测359
\n
29.1案例背景359
\n
29.2理论基础360
\n
29.2.1基本架构360
\n
29.2.2卷积层360
\n
29.2.3池化层362
\n
29.3程序实现362
\n
29.3.1加载数据362
\n
29.3.2构建CNN364
\n
29.3.3训练CNN365
\n
29.3.4评估训练效果367
\n
29.4延伸阅读368
\n
\n
第30章基于深度学习的视觉场景
\n
识别370
\n
30.1案例背景370
\n
30.2理论基础371
\n
30.3程序实现371
\n
30.3.1环境配置372
\n
30.3.2数据集制作373
\n
30.3.3网络训练375
\n
30.3.4网络测试381
\n
30.4延伸阅读383
\n
\n
第31章深度学习综合应用385
\n
31.1应用背景385
\n
31.2理论基础387
\n
31.2.1分类识别387
\n
31.2.2目标检测391
\n
31.3案例实现1:基于CNN的数字识别395
\n
31.3.1自定义CNN397
\n
31.3.2AlexNet399
\n
31.3.3基于MATLAB进行实验设计405
\n
31.3.4基于TensorFlow进行实验设计413
\n
31.3.5实验小结418
\n
31.4案例实现2:基于CNN的物体识别418
\n
31.4.1CIFAR-10数据集418
\n
31.4.2VggNet421
\n
31.4.3ResNet422
\n
31.4.4实验设计424
\n
31.4.5实验小结432
\n
31.5案例实现3:基于CNN的图像矫正432
\n
31.5.1倾斜数据集432
\n
31.5.2自定义CNN回归网络434
\n
31.5.3AlexNet回归网络436
\n
31.5.4实验设计437
\n
31.5.5实验小结445
\n
31.6案例实现4:基于LSTM的时间序列分析445
\n
31.6.1厄尔尼诺南方涛动指数数据446
\n
31.6.2样条拟合分析446
\n
31.6.3基于MATLAB进行LSTM分析448
\n
31.6.4基于Keras进行LSTM分析451
\n
31.6.5实验小结455
\n
31.7案例实现5:基于深度学习的以图搜图技术455
\n
31.7.1人脸的深度特征455
\n
31.7.2AlexNet的特征460
\n
31.7.3GoogleNet的特征461
\n
31.7.4深度特征融合计算462
\n
31.7.5实验设计462
\n
31.7.6实验小结467
\n
31.8案例实现6:基于YOLO的交通目标检测应用467
\n
31.8.1车辆目标的YOLO检测468
\n
31.8.2交通标志的YOLO检测475
\n
31.9延伸阅读481
\n