M2DPCA和NFA相結合的人臉識別方法
人們在日常生活中最常用的身份認證手段就是人臉識別,其也是當前模式識別中一個(gè)最熱門(mén)的研究課題。人臉識別就是將動(dòng)態(tài)捕捉到的人的面部與預先錄用的人臉庫中的人臉進(jìn)行比較識別,F已經(jīng)廣泛地應用于國家安全、刑事偵破等領(lǐng)域。人臉與指紋、虹膜等其他生物特征一樣與生俱來(lái),具有唯一性和不易被復制的良好特性;且人臉識別具有可以遠距離采集人臉圖像,是一種非接觸性的技術(shù),具有非侵犯性的特點(diǎn), 但是人臉圖像的特征空間分布非常復雜;另外,還不能找到完全可分的特征映射和相應曲面進(jìn)行分類(lèi)識別。
特征提取是人臉識別過(guò)程中的關(guān)鍵問(wèn)題。在各種特征提取方法中,Belhumeur 等人提出的Fisher 臉(Fisherfaces)方法和Turk 等人提出的特征臉?lè )椒ǎ‥igenfaces)方法[3]是兩種應用最為廣泛的算法。Fisher 臉?lè )椒ㄊ峭ㄟ^(guò)線(xiàn)性判別分析(Linear Discriminant Analysis,LDA)尋找使類(lèi)內距和類(lèi)間距最小比值的投影方向來(lái)獲取判別信息, 是一種有監督的方法。
使用LDA 方法進(jìn)行人臉識別時(shí),可能遇到兩大問(wèn)題:1)小樣本問(wèn)題(Small Simple Size,SSS);2)邊緣類(lèi)的存在造成投影空間中近鄰樣本的重疊。且由于LDA 方法中的類(lèi)間散布矩陣Sb的秩最多有c-1 個(gè),因此,特征向量最多有c-1 個(gè)。對于高維數據,要很好地區分各個(gè)類(lèi),只有c-1 個(gè)特征是不充分的。此外,類(lèi)內散布矩陣只考慮了類(lèi)的中心,沒(méi)有考慮類(lèi)的邊界結構, 而這些邊界結構已經(jīng)證明了在分類(lèi)時(shí)有很大作用的,這些問(wèn)題導致了LDA 方法性能的不穩定。為解決這些問(wèn)題,Li等人于2009 年提出了非參數子空間分析方法(Non-parametricSubspace Analysis,NSA)。主成分分析(Principal ComponentAnalysis, PCA)在做特征提取時(shí)提取的是全局特征,識別效果往往不是很理想, 而實(shí)際上當人臉表情和光照條件變化時(shí), 僅部分人臉區域變化明顯, 而其他部分變化不大, 甚至無(wú)變化。M2DPCA 方法則是對PCA 算法的改進(jìn),它是對劃分后的子圖像進(jìn)行鑒別分析, 可以捕捉人臉的局部信息特征,有利于識別。
由于NSA 方法中的類(lèi)內散布矩陣Sw 仍然和LDA 的一樣,這樣可能會(huì )影響識別效果;且NSA 方法計算類(lèi)間散步矩陣沒(méi)有考慮到不同的KNN 點(diǎn)有助于構建不同的類(lèi)間散布矩陣。Li 等人提出了非參數特征分析(nonparametric featureanalysis,NFA)方法,本文在降維方面作了改進(jìn)即先對圖像矩陣分塊并采用2DPCA 進(jìn)行特征預提取, 得到替代原始圖像的低維新模式后對其施行NFA 方法。在ORL 人臉庫及XM2VTS人臉庫上驗證了該方法, 其識別性能優(yōu)于LDA 方法、NFA方法。
1 M2DPCA+NFA
1.1 基于M2DPCA 的特征提取
設模式類(lèi)別有C 個(gè):C1,C2,…,CC,第i 類(lèi)有ni個(gè)樣本。訓練樣本圖像為:
訓練樣本A i的p×q 塊圖像矩陣表示為:
其中每個(gè)子圖像矩陣(Ai(j))k,l(i=1,2,Λ,c;j=1,2,Λ,ni;k=1,2,Λ,p;l=1,2,Λ,q)是m1×n1(m1×p=m,n1×q=n)矩陣。
訓練樣本的總體散布矩陣為:
其中M=Npq 表示訓練樣本子圖像矩陣總數:
l 是所有訓練樣本子矩陣的總體平均值,我們很容易就能得出Gt 為m1×m1的非負定矩陣。
定義準則函數:
Gt 的前t 個(gè)最大特征值所對應的標準正交的特征向量Z1,Z2,…,Zt為最優(yōu)投影向量組,最優(yōu)投影矩陣Q=[Z1,Z2,…,Zt]。由此可得訓練樣本在Q 上投影的特征矩陣:
值得注意的是:在對原圖像施行模塊化2DPCA過(guò)程中,當確定圖像分塊后,投影軸個(gè)數t 的取值就決定了特征矩陣Bi(j)的維數。若t 值取小了, 特征矩陣中會(huì )遺失許多不利于稍后分類(lèi)的鑒別信息,然而t 值取大了, 則特征矩陣中又將存在大量不利于降維的冗余信息。t 可按如下方法取值,先求總體離散矩陣Gt的特征向量,按降序排列為:λ1,λ2,…,λme,令
l=1,2,Λme,則t 取使得min{ηl /ηme≥1-ε(0<ε≤0.01)}成立的l 值。
1.2 基于NFA 的特征提取
令(xi(j))k,l=Vec(Bi(j))k,l,則(xi(j))k,l∈R m1 n1 ,k=1,2,…,p,l=1,2,…,q;第i 類(lèi)第j 個(gè)圖像樣本的子圖像矩陣的均值為:
定義新的類(lèi)間散布矩陣:
新的類(lèi)內散布矩陣:
其中,NNk(xi(j),l)為類(lèi)l 到xi(j)的K 個(gè)最近鄰的集合,式(6)中權值w(i,j,l)為:
式(7)中α 是一個(gè)正參數,可以控制關(guān)于距離比的權值變化速度,d(xi(j) ,NNk(xi(j) ,l))是xi(j)到集合NNk(xi(j) ,l)距離。
于是,相應的準則函數為:
取特征方程SbNFAω=λSwNFAω 的前d 個(gè)最大特征值對應的特征向量作為最優(yōu)鑒別向量。
2 實(shí)驗結果與分析
2.1 在ORL 人臉庫上的實(shí)驗
ORL 人臉庫中共有40 人在不同時(shí)期不同狀態(tài)下拍攝的10 張照片,每張照片的分辨率均為112×92,照片有側面、正面;表情嚴肅、表情放松;睜眼、閉眼;微笑、不笑;戴眼鏡、不戴眼鏡等諸多差別。以下是取自人臉庫的一組照片:
圖1 ORL 人臉庫
表1 給出了對原始圖像矩陣進(jìn)行8×4、16×4 即圖像子矩陣大小分別是14×23、7×23 兩種分塊后與LDA、NFA 方法對比的結果。分類(lèi)器為最小距離分類(lèi)器[8]。
本文中取ε≤0.01。由表1 數據可以看出,8×4 分塊和16×4 分塊在識別率方面均要優(yōu)于LDA 和NFA 方法。
2.2 在XM2VTS 人臉庫上的實(shí)驗
XM2VTS 人臉庫中共有295 人在不同環(huán)境不同表情下拍攝的8 張照片, 每張照片的分辨率均為55×51, 照片包括低頭、抬頭,戴眼鏡、不戴眼鏡,表情憤怒、表情平和,側臉、正臉,有妝、無(wú)妝等各種差異。以下是取自人臉庫的一組照片:
圖2 XM2VTS 人臉庫
本實(shí)驗中以每組前4 張作為訓練樣本, 后4 張作為測試樣本?偟挠柧殬颖竞涂偟臏y試樣本均為1 180 張。實(shí)驗的結果, 正確識別率的對應關(guān)系見(jiàn)表2,表2 給出了對原始圖像矩陣進(jìn)行11×3 和5×17 即圖像子矩陣大小分別是5×17 和11×3 兩種分塊后與LDA、NFA 方法對比的結果。分類(lèi)器為最小距離分類(lèi)器。
由表1 和表2 的數據可以看出, 在識別率方面本文方法均要優(yōu)于LDA 和NFA 方法。具體言之, 在ORL 數據庫中,LDA 方法結果是93.50%, 而NFA 方法的結果是98.00%,新方法的最高識別率達99.00%。在XM2VTS 數據庫中,LDA 方法的結果是84.42%,NFA 方法的結果是94.90%,新方法的最高識別率為94.83%。本方法在ORL 人臉庫上效果較為明顯。
LDA 方法和NSA 方法在處理數據時(shí)只對一維數據進(jìn)行處理,大大增加了計算量,容易出現“小樣本問(wèn)題”。而本文的方法首先使用模塊化2DPCA 對二維數據進(jìn)行特征提取,考慮到了圖像的局部特征,而且圖像維數的降低,減少了計算量。在此基礎上轉化為一維數據使用NSA 方法,考慮到了類(lèi)內及類(lèi)間的差異性,可以取得更好的識別率。
3 結論
本文在NFA 的基礎上提出了M2DPCA 和NFA 相結合的一種新的人臉識別方法。首先利用模塊化2DPCA 對原始數據進(jìn)行預處理,再對得到的新的圖像樣本實(shí)行NSA 判別分析,這樣做的優(yōu)點(diǎn)是能夠抽取到圖像的局部特征,反映圖像之間的差異的同時(shí),亦能降低維數,使計算簡(jiǎn)單,得到更高的識別率。但研究發(fā)現, 對同一個(gè)庫中的原始圖像分塊方法的不同,識別率一般都不同,因此,如何分塊才能得到更高的識別率有待于進(jìn)一步研究。
M2DPCA和NFA相結合的人臉識別方法