計算機(jī)視覺的應(yīng)用越來越廣泛,已經(jīng)成功的被應(yīng)用到機(jī)器人、自動駕駛、醫(yī)學(xué)成像和診斷、監(jiān)控、視頻分析等領(lǐng)域,甚至已將跟蹤用于體育分析中。本書為讀者提供了重要的數(shù)學(xué)和算法工具,使他們能夠深入了解任何完整的計算機(jī)視覺系統(tǒng)的基本組成部分,并設(shè)計出同樣的系統(tǒng)。這些內(nèi)容包括識別局部特征,如在存在噪聲情況下角或邊的識別、邊緣保持下的平滑、連通成分的標(biāo)記、立體視覺、閾值處理、聚類、分割,以及描述、匹配形狀和場景等。
本書使用了各種廣泛的例子,包括面部圖片、卡通圖片、動物腳印和血管造影圖片等等。另外,本書每個章節(jié)后都留有對應(yīng)作業(yè)和建議實(shí)驗(yàn)的項(xiàng)目。
本書可以作為高年級本科生和低年級研究生的參考用書,也可以作為從事計算機(jī)視覺技術(shù)研究的從業(yè)者和科技人員的參考用書。
譯者序
前言
致老師
第一部分 導(dǎo)論
第1章 計算機(jī)視覺的定義及其歷史2
1.1 簡介2
1.2 定義2
1.3 局部全局問題3
1.4 生物視覺4
1.4.1 生物動因4
1.4.2 視覺感知6
參考文獻(xiàn)7
第2章 編寫圖像處理程序8
2.1 簡介8
2.2 圖像處理的基本程序結(jié)構(gòu)8
2.3 良好的編程風(fēng)格9
2.4 計算機(jī)視覺的重點(diǎn)9
2.5 圖像分析軟件工具包10
2.6 makefile10
2.7 作業(yè)11
參考文獻(xiàn)11
第3章 數(shù)學(xué)原理回顧12
3.1 簡介12
3.2 線性代數(shù)簡要回顧12
3.2.1 向量12
3.2.2 向量空間14
3.2.3 零空間15
3.2.4 函數(shù)空間16
3.2.5 線性變換17
3.2.6 導(dǎo)數(shù)和導(dǎo)數(shù)算子19
3.2.7 特征值和特征向量20
3.2.8 特征分解21
3.2.9 奇異值分解21
3.3 函數(shù)最小化簡要回顧23
3.3.1 梯度下降23
3.3.2 局部最小值和全局最小值26
3.3.3 模擬退火27
3.4 概率論簡要回顧28
3.5 作業(yè)30
參考文獻(xiàn)31
第4章 圖像:表示和創(chuàng)建32
4.1 簡介32
4.2 圖像表示32
4.2.1 標(biāo)志性表示(圖像)32
4.2.2 函數(shù)表示(方程)34
4.2.3 線性表示(向量)34
4.2.4 概率表示(隨機(jī)場)35
4.2.5 圖形表示(圖)35
4.2.6 鄰接悖論和六邊形像素36
4.3 作為曲面的圖像38
4.3.1 梯度38
4.3.2 等值線38
4.3.3 脊39
4.4 作業(yè)39
參考文獻(xiàn)40
第二部分 預(yù)處理
第5章 卷積核算子42
5.1 簡介42
5.2 線性算子42
5.3 圖像的向量表示44
5.4 導(dǎo)數(shù)估計45
5.4.1 使用核估計導(dǎo)數(shù)46
5.4.2 通過函數(shù)擬合來估計導(dǎo)數(shù)46
5.4.3 圖像基向量49
5.4.4 核作為采樣可微分函數(shù)50
5.4.5 其他高階導(dǎo)數(shù)53
5.4.6 尺度簡介54
5.5 邊緣檢測55
5.6 尺度空間58
5.6.1 金字塔58
5.6.2 沒有重采樣的尺度空間59
5.7 示例61
5.8 數(shù)字梯度檢測器的性能63
5.8.1 方向?qū)?shù)63
5.8.2 方向估計67
5.8.3 討論70
5.9 總結(jié)71
5.10 作業(yè)71
參考文獻(xiàn)76
第6章 去噪78
6.1 簡介78
6.2 圖像平滑78
6.2.1 一維情況79
6.2.2 二維情況79
6.3 使用雙邊濾波器實(shí)現(xiàn)保邊平滑82
6.4 使用擴(kuò)散方程實(shí)現(xiàn)保邊平滑84
6.4.1 一維空間的擴(kuò)散方程84
6.4.2 PDE模擬85
6.4.3 二維空間的擴(kuò)散方程85
6.4.4 可變電導(dǎo)擴(kuò)散86
6.5 使用優(yōu)化實(shí)現(xiàn)保邊平滑87
6.5.1 噪聲消除的目標(biāo)函數(shù)87
6.5.2 尋找一個先驗(yàn)項(xiàng)90
6.5.3 MAP算法實(shí)現(xiàn)和均場退火92
6.5.4 病態(tài)問題和正則化94
6.6 等效算法95
6.7 總結(jié)97
6.8 作業(yè)97
參考文獻(xiàn)99
第7章 數(shù)學(xué)形態(tài)學(xué)101
7.1 簡介101
7.2 二值形態(tài)學(xué)101
7.2.1 膨脹101
7.2.2 腐蝕106
7.2.3 膨脹和腐蝕的性質(zhì)107
7.2.4 開運(yùn)算和閉運(yùn)算108
7.2.5 開運(yùn)算和閉運(yùn)算的性質(zhì)109
7.3 灰度形態(tài)學(xué)109
7.3.1 使用平面結(jié)構(gòu)元素的灰度圖像110
7.3.2 使用灰度結(jié)構(gòu)元素的灰度圖像113
7.3.3 使用集合運(yùn)算的灰度形態(tài)學(xué)114
7.4 距離變換114
7.4.1 使用迭代最近鄰計算DT115
7.4.2 使用二值形態(tài)運(yùn)算計算DT115
7.4.3 使用掩碼計算DT115
7.4.4 使用維諾圖計算DT117
7.5 邊緣鏈接的應(yīng)用117
7.6 總結(jié)120
7.7 作業(yè)121
參考文獻(xiàn)122
第三部分 圖像理解
第8章 分割124
8.1 簡介124
8.2 閾值:僅基于亮度的分割125
8.2.1 閾值的局部性質(zhì)125
8.2.2 通過直方圖分析選擇閾值126
8.2.3 用高斯和擬合直方圖129
8.2.4 高斯混合模型與期望最大化130
8.3 聚類:基于顏色相似度的分割132
8.3.1 k-均值聚類133
8.3.2 均值移位聚類135
8.4 連接組件:使用區(qū)域增長的空間分割136
8.4.1 遞歸方法136
8.4.2 迭代方法138
8.4.3 示例應(yīng)用139
8.5 使用主動輪廓進(jìn)行分割140
8.5.1 snake:離散和連續(xù)140
8.5.2 水平集:包含邊或者不包含邊144
8.6 分水嶺:基于亮度曲面的分割151
8.7 圖割:基于圖論的分割156
8.7.1 目標(biāo)函數(shù)157
8.7.2 求解目標(biāo)函數(shù)158
8.8 使用MFA進(jìn)行分割159
8.9 評估分割的質(zhì)量160
8.10 總結(jié)161
8.11 作業(yè)162
參考文獻(xiàn)163
第9章 參數(shù)變換167
9.1 簡介167
9.2 霍夫變換168
9.2.1 垂線問題169
9.2.2 如何找到交點(diǎn)——累加器數(shù)組169
9.2.3 使用梯度降低計算復(fù)雜度170
9.3 尋找圓171
9.3.1 由任意三個非共線像素表示的圓的位置推導(dǎo)171
9.3.2 當(dāng)原點(diǎn)未知但半徑已知時找圓172
9.3.3 利用梯度信息減少找圓的計算172
9.4 尋找橢圓172
9.5 廣義霍夫變換174
9.6 尋找峰值175
9.7 尋找三維形狀——高斯圖176
9.8 尋找對應(yīng)體——立體視覺中的參數(shù)一致性177
9.9 總結(jié)179
9.10 作業(yè)179
參考文獻(xiàn)180
第10章 表示法和形狀匹配181
10.1 簡介181
10.2 線性變換182
10.2.1 剛體變換182
10.2.2 仿射變換183
10.2.3 規(guī)范和指標(biāo)184
10.3 協(xié)方差矩陣185
10.3.1 K-L擴(kuò)展的推導(dǎo)186
10.3.2 K-L擴(kuò)展的特性188
10.3.3 群190
10.4 區(qū)域特征191
10.4.1 簡單特征191
10.4.2 矩193
10.4.3 鏈碼195
10.4.4 傅里葉描述符195
10.4.5 中軸196
10.5 匹配特征向量197
10.5.1 匹配簡單特征197
10.5.2 匹配向量197
10.5.3 將向量與類匹配198
10.6 使用邊界描述形狀199
10.6.1 形狀矩陣200
10.6.2 形狀上下文201
10.6.3 曲率尺度空間202
10.6.4 SKS模型204
10.7 形狀空間中的測地線208
10.7.1 二維形狀208
10.7.2 一個封閉的邊界作為向量210
10.7.3 向量空間210
10.7.4 流形211
10.7.5 投影到閉合曲線上的流形212
10.7.6 找到一條測地線215
10.8 總結(jié)217
10.9 作業(yè)217
參考文獻(xiàn)219
第11章 場景表示和匹配221
11.1 簡介221
11.2 匹配的標(biāo)志性表示221
11.2.1 將模板匹配到場景221
11.2.2 點(diǎn)匹配222
11.2.3 特征圖像223
11.3 興趣運(yùn)算225
11.3.1 Harris-Laplace運(yùn)算226
11.3.2 SIFT興趣運(yùn)算228
11.4 SIFT231
11.4.1 SIFT描述符231
11.4.2 使用SIFT描述符匹配鄰域231
11.5 SKS231
11.5.1 SKS描述符232
11.5.2 使用SKS描述符匹配鄰域233
11.6 方向梯度直方圖234
11.6.1 方向梯度直方圖描述符235
11.6.2 匹配方向梯度直方圖描述符235
11.7 圖匹配236
11.7.1 關(guān)聯(lián)圖237
11.7.2 松弛標(biāo)記239
11.7.3 彈簧與模板240
11.8 再論彈簧和模板241
11.9 可變形模板241
11.10 總結(jié)242
11.11 作業(yè)243
參考文獻(xiàn)246
第四部分 在三維世界中的二維圖像
第12章 三維相關(guān)250
12.1 簡介250
12.2 幾何相機(jī)——兩個已知相機(jī)的范圍(立體視覺)251
12.2.1 投影251
12.2.2 投影相機(jī)252
12.2.3 坐標(biāo)系254
12.3 從運(yùn)動中恢復(fù)形狀——兩個未知相機(jī)的范圍258
12.3.1 立體視覺與對應(yīng)問題258
12.3.2 8點(diǎn)算法261
12.3.3 尋找相機(jī)矩陣262
12.3.4 相機(jī)矩陣的立體視覺263
12.3.5 基本歧義264
12.4 圖像拼接和單應(yīng)性264
12.4.1 視差267
12.4.2 匹配幾何不變量269
12.5 控制照明——一個攝像頭和一個光源的范圍271
12.6 從x中恢復(fù)形狀——單個相機(jī)的范圍273
12.6.1 從陰影中恢復(fù)形狀273
12.6.2 使用兩個光源的著色形狀274
12.6.3 表面法線的形狀276
12.6.4 光度立體視覺法276
12.6.5 超過三個光源的光度立體視覺法277
12.6.6 從紋理中恢復(fù)形狀278
12.6.7 從焦點(diǎn)中恢復(fù)形狀278
12.7 三維空間的曲面279
12.7.1 二階曲面279
12.7.2 將二階曲面擬合到數(shù)據(jù)280
12.7.3 擬合橢圓和橢球體282
12.8 總結(jié)283
12.9 作業(yè)284
參考文獻(xiàn)286
第13章 開發(fā)計算機(jī)視覺算法290
參考文獻(xiàn)292
附錄A 支持向量機(jī)293
附錄B 如何區(qū)分包含核運(yùn)算符的函數(shù)298
附錄C 圖像文件系統(tǒng)軟件300
索引305