M2DPCA和NFA相結合的人臉識別方法
人們在日常生活中最常用的身份認證手段就是人臉識別,其也是當前模式識別中一個最熱門的研究課題。人臉識別就是將動態(tài)捕捉到的人的面部與預先錄用的人臉庫中的人臉進行比較識別,F(xiàn)已經(jīng)廣泛地應用于國家安全、刑事偵破等領域。人臉與指紋、虹膜等其他生物特征一樣與生俱來,具有唯一性和不易被復制的良好特性;且人臉識別具有可以遠距離采集人臉圖像,是一種非接觸性的技術,具有非侵犯性的特點, 但是人臉圖像的特征空間分布非常復雜;另外,還不能找到完全可分的特征映射和相應曲面進行分類識別。
特征提取是人臉識別過程中的關鍵問題。在各種特征提取方法中,Belhumeur 等人提出的Fisher 臉(Fisherfaces)方法和Turk 等人提出的特征臉方法(Eigenfaces)方法[3]是兩種應用最為廣泛的算法。Fisher 臉方法是通過線性判別分析(Linear Discriminant Analysis,LDA)尋找使類內距和類間距最小比值的投影方向來獲取判別信息, 是一種有監(jiān)督的方法。
使用LDA 方法進行人臉識別時,可能遇到兩大問題:1)小樣本問題(Small Simple Size,SSS);2)邊緣類的存在造成投影空間中近鄰樣本的重疊。且由于LDA 方法中的類間散布矩陣Sb的秩最多有c-1 個,因此,特征向量最多有c-1 個。對于高維數(shù)據(jù),要很好地區(qū)分各個類,只有c-1 個特征是不充分的。此外,類內散布矩陣只考慮了類的中心,沒有考慮類的邊界結構, 而這些邊界結構已經(jīng)證明了在分類時有很大作用的,這些問題導致了LDA 方法性能的不穩(wěn)定。為解決這些問題,Li等人于2009 年提出了非參數(shù)子空間分析方法(Non-parametricSubspace Analysis,NSA)。主成分分析(Principal ComponentAnalysis, PCA)在做特征提取時提取的是全局特征,識別效果往往不是很理想, 而實際上當人臉表情和光照條件變化時, 僅部分人臉區(qū)域變化明顯, 而其他部分變化不大, 甚至無變化。M2DPCA 方法則是對PCA 算法的改進,它是對劃分后的子圖像進行鑒別分析, 可以捕捉人臉的局部信息特征,有利于識別。
由于NSA 方法中的類內散布矩陣Sw 仍然和LDA 的一樣,這樣可能會影響識別效果;且NSA 方法計算類間散步矩陣沒有考慮到不同的KNN 點有助于構建不同的類間散布矩陣。Li 等人提出了非參數(shù)特征分析(nonparametric featureanalysis,NFA)方法,本文在降維方面作了改進即先對圖像矩陣分塊并采用2DPCA 進行特征預提取, 得到替代原始圖像的低維新模式后對其施行NFA 方法。在ORL 人臉庫及XM2VTS人臉庫上驗證了該方法, 其識別性能優(yōu)于LDA 方法、NFA方法。
1 M2DPCA+NFA
1.1 基于M2DPCA 的特征提取
設模式類別有C 個:C1,C2,…,CC,第i 類有ni個樣本。訓練樣本圖像為:

訓練樣本A i的p×q 塊圖像矩陣表示為:

其中每個子圖像矩陣(Ai(j))k,l(i=1,2,Λ,c;j=1,2,Λ,ni;k=1,2,Λ,p;l=1,2,Λ,q)是m1×n1(m1×p=m,n1×q=n)矩陣。
訓練樣本的總體散布矩陣為:

其中M=Npq 表示訓練樣本子圖像矩陣總數(shù):

l 是所有訓練樣本子矩陣的總體平均值,我們很容易就能得出Gt 為m1×m1的非負定矩陣。
定義準則函數(shù):

Gt 的前t 個最大特征值所對應的標準正交的特征向量Z1,Z2,…,Zt為最優(yōu)投影向量組,最優(yōu)投影矩陣Q=[Z1,Z2,…,Zt]。由此可得訓練樣本在Q 上投影的特征矩陣:

值得注意的是:在對原圖像施行模塊化2DPCA過程中,當確定圖像分塊后,投影軸個數(shù)t 的取值就決定了特征矩陣Bi(j)的維數(shù)。若t 值取小了, 特征矩陣中會遺失許多不利于稍后分類的鑒別信息,然而t 值取大了, 則特征矩陣中又將存在大量不利于降維的冗余信息。t 可按如下方法取值,先求總體離散矩陣Gt的特征向量,按降序排列為:λ1,λ2,…,λme,令

l=1,2,Λme,則t 取使得min{ηl /ηme≥1-ε(0<ε≤0.01)}成立的l 值。
1.2 基于NFA 的特征提取
令(xi(j))k,l=Vec(Bi(j))k,l,則(xi(j))k,l∈R m1 n1 ,k=1,2,…,p,l=1,2,…,q;第i 類第j 個圖像樣本的子圖像矩陣的均值為:

定義新的類間散布矩陣:

新的類內散布矩陣:

其中,NNk(xi(j),l)為類l 到xi(j)的K 個最近鄰的集合,式(6)中權值w(i,j,l)為:

式(7)中α 是一個正參數(shù),可以控制關于距離比的權值變化速度,d(xi(j) ,NNk(xi(j) ,l))是xi(j)到集合NNk(xi(j) ,l)距離。
于是,相應的準則函數(shù)為:

取特征方程SbNFAω=λSwNFAω 的前d 個最大特征值對應的特征向量作為最優(yōu)鑒別向量。
2 實驗結果與分析
2.1 在ORL 人臉庫上的實驗
ORL 人臉庫中共有40 人在不同時期不同狀態(tài)下拍攝的10 張照片,每張照片的分辨率均為112×92,照片有側面、正面;表情嚴肅、表情放松;睜眼、閉眼;微笑、不笑;戴眼鏡、不戴眼鏡等諸多差別。以下是取自人臉庫的一組照片:

圖1 ORL 人臉庫
表1 給出了對原始圖像矩陣進行8×4、16×4 即圖像子矩陣大小分別是14×23、7×23 兩種分塊后與LDA、NFA 方法對比的結果。分類器為最小距離分類器[8]。

本文中取ε≤0.01。由表1 數(shù)據(jù)可以看出,8×4 分塊和16×4 分塊在識別率方面均要優(yōu)于LDA 和NFA 方法。
2.2 在XM2VTS 人臉庫上的實驗
XM2VTS 人臉庫中共有295 人在不同環(huán)境不同表情下拍攝的8 張照片, 每張照片的分辨率均為55×51, 照片包括低頭、抬頭,戴眼鏡、不戴眼鏡,表情憤怒、表情平和,側臉、正臉,有妝、無妝等各種差異。以下是取自人臉庫的一組照片:

圖2 XM2VTS 人臉庫
本實驗中以每組前4 張作為訓練樣本, 后4 張作為測試樣本?偟挠柧殬颖竞涂偟臏y試樣本均為1 180 張。實驗的結果, 正確識別率的對應關系見表2,表2 給出了對原始圖像矩陣進行11×3 和5×17 即圖像子矩陣大小分別是5×17 和11×3 兩種分塊后與LDA、NFA 方法對比的結果。分類器為最小距離分類器。

由表1 和表2 的數(shù)據(jù)可以看出, 在識別率方面本文方法均要優(yōu)于LDA 和NFA 方法。具體言之, 在ORL 數(shù)據(jù)庫中,LDA 方法結果是93.50%, 而NFA 方法的結果是98.00%,新方法的最高識別率達99.00%。在XM2VTS 數(shù)據(jù)庫中,LDA 方法的結果是84.42%,NFA 方法的結果是94.90%,新方法的最高識別率為94.83%。本方法在ORL 人臉庫上效果較為明顯。
LDA 方法和NSA 方法在處理數(shù)據(jù)時只對一維數(shù)據(jù)進行處理,大大增加了計算量,容易出現(xiàn)“小樣本問題”。而本文的方法首先使用模塊化2DPCA 對二維數(shù)據(jù)進行特征提取,考慮到了圖像的局部特征,而且圖像維數(shù)的降低,減少了計算量。在此基礎上轉化為一維數(shù)據(jù)使用NSA 方法,考慮到了類內及類間的差異性,可以取得更好的識別率。
3 結論
本文在NFA 的基礎上提出了M2DPCA 和NFA 相結合的一種新的人臉識別方法。首先利用模塊化2DPCA 對原始數(shù)據(jù)進行預處理,再對得到的新的圖像樣本實行NSA 判別分析,這樣做的優(yōu)點是能夠抽取到圖像的局部特征,反映圖像之間的差異的同時,亦能降低維數(shù),使計算簡單,得到更高的識別率。但研究發(fā)現(xiàn), 對同一個庫中的原始圖像分塊方法的不同,識別率一般都不同,因此,如何分塊才能得到更高的識別率有待于進一步研究。
M2DPCA和NFA相結合的人臉識別方法