引言
近年來(lái),數字圖像技術(shù)的應用范圍越來(lái)越廣泛,運用生物識別技術(shù)的身份驗證則更是由于其在公安(罪犯識別等) 、安全監控系統[1]、信用卡驗證等方面的巨大應用前景而越來(lái)越成為當前人工智能領(lǐng)域的一個(gè)研究熱點(diǎn)。這其中,利用人臉特征進(jìn)行身份驗證又是最自然最直接的手段,相比于指紋、視網(wǎng)膜、虹膜、基因等其它人體生物特征,它具有直接、友好、方便的特點(diǎn),更易于為用戶(hù)所接受,因此備受關(guān)注。
人臉識別技術(shù)是根據人的臉面特征唯一性特點(diǎn)而進(jìn)行的個(gè)體識別和確認技術(shù)。人的面部特征的唯一性,可以在臉上某一單一器官或部位上得以人臉識別技術(shù)的門(mén)禁系統設計與實(shí)現 體現,更重要的是可在這些單一特征之間的位置、距離、角度、數量、形狀和模式等相互關(guān)系上得以體現,而且這些面部特征都具有一定的穩定性。當驗證某人的身份時(shí),只要通過(guò)某種設備攝錄下他的面部生物學(xué)特征,與事先已經(jīng)儲存著(zhù)的相關(guān)樣本特征進(jìn)行比較,幾秒鐘內即可完成識別。同許多生物識別技術(shù)一樣,人的面部識別技術(shù)是近幾年在全球范圍內迅速發(fā)展起來(lái)的一項安全技術(shù)。它依靠面部的二維或三維圖像處理和模式識別來(lái)實(shí)現鑒別或驗證個(gè)體身份目的,具有非接觸性、對被識別對象侵擾少和識別手段隱蔽等特點(diǎn),在反恐、跟蹤、追逃、打拐、出入口控制、銀行管理等許多領(lǐng)域都有著(zhù)獨特 的應用價(jià)值。
利用人臉識別技術(shù)和視頻監控技術(shù)開(kāi)發(fā)的門(mén)禁系統,可廣泛適用于智能管理系統(智能大樓、高級住宅門(mén)禁系統)、銀行及金庫門(mén)安全系統、醫院血液中心身份管理系統等高可靠性、高安全性的場(chǎng)所。這無(wú)疑將成為21世紀遠程監控的新發(fā)展趨勢,具有廣泛的應用前景和巨大的市場(chǎng)潛力。
圖1 人臉識別流程圖
支持向量機的人臉識別算法
人臉識別應包含學(xué)習和識別兩個(gè)階段,其流程如圖1所示。訓練階段建立支持向量機分類(lèi)模型,主要步驟為對人臉圖像預處理,獲得人臉區域再利用膚色和幾何特征,獲得人臉特征向量訓練集。由人臉特征向量訓練集建立個(gè)體用戶(hù)的支持向量機分類(lèi)模型。識別階段主要步驟為首先由待識別者所聲稱(chēng)的身份,確定所要使用的支持向量機分類(lèi)模型,同時(shí)對待識別者的人臉圖像進(jìn)行預處理,獲得人臉區域,再利用膚色和幾何特征提取人臉特征向量,將該向量輸入到所確定的支持向量機模型進(jìn)行分類(lèi),以確定待識別者聲稱(chēng)的身份真實(shí)與否。
系統的組成和功能
門(mén)禁系統的組成結構
本系統由攝像控制模塊、報警驅動(dòng)控制模塊和顯示錄像模塊、門(mén)鎖控制模塊四部分組成[2]。攝像控制模塊主要完成人臉圖像的采集、驗證、登記使用人員的人臉圖像,取消人臉和重置使用,以及設定管理人員的權限。攝像控制模塊主要完成各監視點(diǎn)(區)的圖像傳送與控制。報警驅動(dòng)控制模塊和門(mén)鎖控制模塊主要完成各控制點(diǎn)門(mén)的開(kāi)啟、報警等功能。顯示錄像模塊進(jìn)行實(shí)時(shí)顯示和錄像。門(mén)禁系統的結構如圖2所示。主要包括:
、贁z像頭;
、赗S232/485轉換器;
、坶T(mén)控制器、配套電鎖;
、躓INDOWS98 驅動(dòng)軟件及用于圖像顯示、人臉采集處理和管理、驅動(dòng)的多媒體應用軟件平臺。
圖2 門(mén)禁系統的結構圖
人臉識別門(mén)禁系統的功能及通信協(xié)議
本系統所依賴(lài)的攝像頭通過(guò)接口與本系統的運行平臺相連;谌四樧R別的門(mén)禁系統的接口需求可分為兩個(gè)部分:應用編程接口和通訊協(xié)議。
應用編程接口
本系統是作為一種軟件部件的形式,嵌入到各種相關(guān)應用系統中去,為其提供安全的用戶(hù)身份認證服務(wù)。為實(shí)現這一目的,本系統的客戶(hù)部分需要以接口函數的形式提供注冊、認證功能。
通信協(xié)議
通訊協(xié)議就是通訊各方的約定,沒(méi)有固定的格式方法,由開(kāi)發(fā)商自行定義。在實(shí)際使用時(shí),由于各種干擾因素,往往會(huì )發(fā)生誤動(dòng)作的情況,因此通訊協(xié)議必須能抵擋各種干擾因素。為了得到可靠的通訊協(xié)議,我們常常在要發(fā)送的數據前加同步位,發(fā)送的數據后加結束位,以及加入校驗字節等等方法。本系統的網(wǎng)絡(luò )通訊協(xié)議采用串口控制單片機,不直接與任何網(wǎng)絡(luò )通訊硬件設備進(jìn)行交互。本文中我們確定如下的通訊協(xié)議。
1、數據為5個(gè)字節,第1字節表示數據校驗位,第2字節表示數據校驗位,第3字節表示數據校驗位,第4字節表示數據位1,第5字節表示數據位2。
2、第1、2、3字節表示校驗位,固定為“P”“Z”“K”;第4字節表示數據位。
3、第4字節即數據1,位=1則繼電器開(kāi),位=0則繼電器1關(guān)。
4、第3字節即數據2,位=1則繼電器開(kāi),位=0則繼電器2關(guān)。
因此如果接收到數據PKZ11,首先判斷第1 、2 、3 字節是否=“P”“K”“Z”,再判斷第4、5字節,如果=11,則繼電器開(kāi),即電控鎖關(guān)。
本系統的目標是使人臉特征向量作為身份認證的手段,對用戶(hù)進(jìn)行認證,判斷該用戶(hù)是否為他(她)所聲稱(chēng)的用戶(hù)。因此,根據身份認證和人臉識別技術(shù)的特點(diǎn),系統需要實(shí)現以下
功能。
(1)人臉檢測和特征提取功能。
因為在人臉識別時(shí)只需要輸入圖像中人臉的特征向量,而通常輸入的圖像中除了人臉之外還有背景信息包含在里面,所以在進(jìn)行人臉識別前的首要任務(wù)就是要從輸入圖像中將人臉特征向量提取出來(lái)。要能有實(shí)時(shí)的、基于視頻流的人臉檢測、跟蹤和特征提取功能,有效地提取人臉特征向量。
(2)人臉識別功能。
要能在提供用戶(hù)口令和人臉圖像信息的情況下實(shí)現迅速的身份認證,所以系統要具有實(shí)時(shí)、高效、準確的人臉識別功能。
(3)數據庫管理功能。
經(jīng)常需要向用戶(hù)信息數據庫中添加、刪除或修改用戶(hù)信息,所以系統需要具有數據庫管理功能,可以將用戶(hù)信息保存到數據庫中,并且可以修改或者刪除數據庫中信息。
(4)人臉識別門(mén)禁系統還包括錄像監控[3]、門(mén)禁控制和報警三大功能,每個(gè)功能由若干個(gè)相應的子模塊實(shí)現。這些功能模塊提供了人臉的采集、校驗、信號的傳送和驅動(dòng)電路、考勤記錄以及報警等功能。通過(guò)計算機可同時(shí)對若干個(gè)門(mén)禁通道和攝像機進(jìn)行管理,能授權不同的修改權限。開(kāi)門(mén)邏輯可設定為“一人開(kāi)門(mén)”或“多人與開(kāi)門(mén)”方式,即核查一人正確即可開(kāi)門(mén),或同時(shí)對倆人(或三人)的人臉進(jìn)行“與”校驗,結果正確方可驅動(dòng),否則,進(jìn)行報警。
該系統的設計可充分滿(mǎn)足某些特殊門(mén)禁管理的需要。對進(jìn)出人員進(jìn)出時(shí)間、門(mén)和電控鎖的狀態(tài)、報警情況進(jìn)行記錄、錄像,人臉校驗的工作流程如圖3所示。報警功能即非法開(kāi)門(mén)報警。當通過(guò)非法手段開(kāi)門(mén)時(shí),系統會(huì )輸出“非法開(kāi)門(mén)”報警信號,聯(lián)動(dòng)報警系統,保證系統安全可靠地運行。
圖3 人臉門(mén)禁(報警)的工作流程
人臉識別門(mén)禁系統的實(shí)現及其性能指標
該系統采用微軟公司的可視化編程工具M(jìn)icroso Visual Studio 2005作為開(kāi)發(fā)平臺,利用面向對象的分析和設計方法進(jìn)行程序設計。在本文中,該系統主要屬性有:人臉采集攝像頭、控制面板、攝像機等。首先對各對象的屬性建立需求模型[4],然后,確定類(lèi)和對象[5]所屬的主題詞,并按主題詞劃分子系統。
利用面向對象技術(shù)實(shí)現人臉識別門(mén)禁系統的設計,根據P.Coad 和E.Yourdon 提出的面向對象設計模型,進(jìn)行系統設計,它主要由“主體部件”、“用戶(hù)界面部件”、“任務(wù)管理部件”和“數據管理部件”構成?紤]到人臉識別門(mén)禁系統由人臉采集、攝像以及驅動(dòng)電路組成,當系統某個(gè)人臉采集攝像頭被觸發(fā)時(shí),立即激活相應的模塊,系統的設計完全展現了面向對象設計模型的方法。
軟件界面
根據面向對象的分析和設計方法,建立了相應的系統模型,利用C + +編程語(yǔ)言進(jìn)行程序設計,運行界面由五部分組成。
(1)菜單區。進(jìn)行系統的初始化設置和操作功能,由系統設置、校驗、查詢(xún)狀態(tài)、打印、幫助五個(gè)菜單項組成。
(2)圖像顯示區。顯示攝像機的圖像信號。
(3)電控鎖(門(mén))狀態(tài)顯示區。顯示電控鎖(門(mén))開(kāi)啟狀態(tài)。
(4)狀態(tài)條。進(jìn)行系統日期、時(shí)間、報警的顯示。
(5)按鍵控制區。進(jìn)行攝像機的選擇、云臺控制和鏡頭控制等功能。
性能指標
(1)人像獲取時(shí)間小于 2 秒,人像識別時(shí)間小于 2 秒;
(2)人像檢測率 94.5%,錯誤拒絕率小于 2%,錯誤接受率小于 0.05%;
(3)光照條件:自然光照,普通燈光采光;
(4)視頻輸入:320×240 8bit 以上灰度圖像;
(5)數據庫容量:不限(僅取決于數據庫的容量),每人 1-9 幅樣本圖像。
結語(yǔ)
人臉識別門(mén)禁系統是一種全新的多功能系統,它克服了密碼識別系統的局限,解決了傳統密碼識別系統容易被破解的缺陷,提高了系統的安全性、可靠性,本系統把人臉識別和錄像監控技術(shù)有效地結合起來(lái),功能更為完善,更具有商業(yè)價(jià)值。這種新興的多媒體監控系統將逐步滲透到安全、生產(chǎn)、生活的方方面面。隨著(zhù)網(wǎng)絡(luò )技術(shù)、通信技術(shù)及計算機技術(shù)的發(fā)展,它將得到更廣泛的應用。