数字图像物体识别理论详解与实战
作者:柳杨 著
出版时间:2018年版
内容简介
2016年,Alpha Go战胜韩国围棋选手李世艺再次引爆了全球对于人工智能的讨论和关注。计算机视觉作为人工智能技术的基础,受到深度学习的成功影响在近几年内取得了突破性的进展,正在成为影响行业发展的下一个引擎。
巨头们纷纷布局,市场也吸引了越来越多的人才创业参与其中。计算机视觉正在成为人工智能火热的细分领域之一。
《数字图像物体识别理论详解与实战/“十三五”科学技术专著丛书》详细介绍了最近10年计算机视觉领域中图像识别部分的经典算法和理论。
《数字图像物体识别理论详解与实战/“十三五”科学技术专著丛书》前半部分分模块,按照预处理、特征提取、特征聚合、分类的顺序介绍了各方向近年来的经典算法。包括图像处理中的去噪、锐化、人脸检测;SIFT、SURF、ORB等局部特征提取算法;全局特征提取算法;BoW、FV、VLAD、稀疏表示等经典特征聚合算法;分类器、贝叶斯理论等模式识别基础知识。理论阐述力求通俗易懂,尽可能扩大读者范围。
后半部分挑选了3种经典的图像识别算法:HOG+SVM、Sparse Represent Based Classification、Deep Learning;详细讲解了其算法的实现,让读者可以快速实践,更好地学习这些算法。
目录
第1章 绪论
1.1 人工智能
1.2 数字图像处理
1.3 数字图像识别
1.4 本书架构
第2章 图像预处理
2.1 引言
2.2 数字图像去噪
2.2.1 噪声模型
2.2.2 利用空间滤波器去噪
2.2.3 近几年提出的其他去噪算法
2.3 图像锐化
2.3.1 图像的微分
2.3.2 拉普拉斯算子
2.3.3 非锐化掩蔽和高提升滤波
2.4 对比度增强
2.4.1 直方图均衡
2.4.2 指数变换
2.4.3 对数变换
2.4.4 灰度拉伸
2.5 人脸检测
2.5.1 简介
2.5.2 人脸检测问题分类
2.5.3 人脸模式的特征提取
2.5.4 人脸模式的特征综合
2.5.5 人脸检测总结
第3章 特征提取
3.1 引言
3.2 局部特征提取
3.2.1 局部二值模式
3.2.2 方向梯度直方图
3.2.3 SIFT
3.2.4 SURF
3.2.5 FAST
3.2.6 BRIEF
3.2.7 ORB
3.3 全局特征提取
3.3.1 颜色特征
3.3.2 纹理特征
3.3.3 形状特征
3.3.4 深度学习
第4章 特征聚合
4.1 引言
4.2 词袋模型
4.2.1 视觉词袋模型
4.2.2 空间金字塔匹配
4.3 Fisher Vector
4.3.1 Fisher Kernel
4.3.2 Fisher Vector
4.4 VLAD
4.5 合成稀疏模型
4.5.1 合成稀疏模型理论
4.6 分析稀疏模型
4.6.1 分析稀疏模型介绍
第5章 模式识别中的分类理论
5.1 线性分类模型
5.1.1 判别函数
5.1.2 概率生成模型
5.1.3 概率判别模型
5.2 支持向量机
5.2.1 简介
5.2.2 核方法
5.3 神经网络
5.3.1 BP算法
5.3.2 梯度消失
5.3.3 卷积神经网络
第6章 实战演练
6.1 基于HOG的行人检测
6.1.1 整体流程
6.1.2 实现源码
6.1.3 main.cpp
6.2 Robust Face Recognition via Sparse Representation
6.2.1 核心思想介绍
6.2.2 SRC.m
6.3 基于深度学习的图像识别
6.3.1 LeNet
6.3.2 LeNet的Caffe配置文件
参考文献