【安防知識網(wǎng)】人臉識別作為生物識別領域中最自然、最可靠的技術,在中國這樣一個具有世界第一龐大人口基數(shù)的發(fā)展中國家擁有特別的地位。人臉識別應用的發(fā)展?jié)摿υ诂F(xiàn)階段的中國體現(xiàn)得尤其重要,巨大的人口基數(shù),以及越來越頻繁的流動性,14億人口的管理,如何充分利用信息技術進行有效的身份認證,一直是業(yè)內(nèi)持續(xù)關注的焦點。
人臉識別具有自然性和不被察覺性的雙重優(yōu)點。自然性是指該識別方式同人類(甚至其他生物)進行個體識別時所利用的生物特征相同。具體而言,人臉識別是通過觀察比較人臉來區(qū)分和確認身份的,另外具有自然性的識別還有語音識別、體形識別等,而指紋識別、虹膜識別等都不具有自然性,因為人類或者其他生物并不通過此類生物特征區(qū)別個體。
不被察覺的特點對于一種識別方法也很重要,這會使該識別方法不令人反感,并且因為不容易引起人的注意而不容易被欺騙。人臉識別便具有這方面的特點,它完全利用可見光獲取人臉圖像信息,而不同于指紋識別或者虹膜識別,需要利用電子壓力傳感器采集指紋,或者利用紅外線采集虹膜圖像,這些特殊的采集方式很容易被人察覺,從而更有可能被偽裝欺騙。
人臉識別的技術瓶頸
人臉識別被認為是生物特征識別領域甚至人工智能領域最困難的研究課題之一。而人臉識別技術的難點主要體現(xiàn)在人臉作為生物特征的一些特點上。
首先,就人的臉部特征而言,不同個體之間的區(qū)別并不是很明顯,因為每個人的臉部結構都是相似的,甚至是人們臉部器官的分布、結構和外形,這對于利用人臉進行定位是有利的,但是對于利用人臉區(qū)分人類個體是不利的。
其次,人臉的外形很不穩(wěn)定,人們可以通過臉部肌肉的變化產(chǎn)生很多不同的表情,而在不同的角度進行觀察,人臉的視覺圖像也相差很大,這對于利用人臉識別效果的穩(wěn)定性和準確性也帶來了一定的挑戰(zhàn)。
再次,人臉識別還受光照條件(例如白天和夜晚,室內(nèi)和室外等)、人臉的很多遮蓋物(例如口罩、墨鏡、頭發(fā)、胡須等)、年齡等多方面因素的影響。如何規(guī)避這些外因對于人臉識別速度以及人臉識別效果的影響,一直是科研的重點方向。
因此,在人臉識別中,第一類的變化,即人臉外形的變化,是應該放大而作為區(qū)分個體標準的,而第二類的變化,即外界條件對于人臉識別的影響,應該消除,因為它們可以代表同一個個體。通常稱第一類變化為類間變化(inter-class difference),而稱第二類變化為類內(nèi)變化(intra-class difference)。對于人臉,類內(nèi)變化往往大于類間變化,從而使在受類內(nèi)變化干擾的情況下利用類間變化區(qū)分個體變得異常困難。[nextpage]
研發(fā)新思路
隨著技術的發(fā)展與人臉識別市場應用日漸廣泛,針對人臉識別的難題和困境,一些創(chuàng)見性的解決問題方案也相繼提出。在實際操作過程中,雙攝像頭識別法不失為一種新穎的解決方案:右側攝像頭的圖片進行人臉定位和眼睛定位,同時,左側攝像頭與右側攝像頭的圖片進行立體融合,恢復出三維人臉模型,在此基礎上,進行特征提取和比對,實現(xiàn)模板錄入和識別等功能。這樣的優(yōu)勢在于其自然性和不被被測個體察覺的特點,其關鍵技術在于以下幾點。
人臉檢測
人臉檢測部分有兩個功能:一是判斷圖像中是否存在人臉,二是如果存在人臉,確定人臉的確切位置。人臉檢測中如采用級聯(lián)的Adaboost(如圖1)以及Harr特征進行人臉定位,正確率更高,速度更快。
人眼定位
眼睛是人臉中最關鍵的一個部分,也是區(qū)分不同人臉的最重要的一個區(qū)域,同時通過眼睛位置的精確定位后,可以更好對齊人臉上的其它各個器官,所以對眼睛進行精確定位極其重要。采用極小值區(qū)域(MER)原理以及多層結構的方法,便能夠很好的解決眼睛定位的問題(具體見圖2、圖3)。
[nextpage]
二維人臉圖像缺乏三維的信息,容易受到光照、姿態(tài)、表情等的影響,鑒于此,采用雙攝像頭并進行立體融合,恢復出三維人臉模型。三維信息可以用于姿態(tài),光照,眼鏡等模型變換和生成。三維信息恢復過程如圖4。
提取特征
特征是指從人臉圖像中提取的一組能區(qū)分不同人臉的向量,也稱之為人臉表示?;贕abor小波的人臉表示在人臉識別中取得了巨大的成功。由于Gabor小波原始特征維數(shù)過高,計算量大,需要做降維處理,即用低維的向量來表示高維的向量。為了達到運算要求,可以采用張量子空間分析方法(簡稱ORO),把人臉表示看成一個張量,通過迭代方法尋找正交的秩,一張量進行降維, 最終可以有效提取核心特征。[nextpage]
該方法有以下幾個優(yōu)點:一是用張量表示人臉能夠捕獲人臉的局部結構信息;二是張量的每個分量的維數(shù)很低,能夠避免出現(xiàn)LDA(線形判別分析)中的維數(shù)災難問題;三是該方法的降維矩陣遠遠小于LDA的降維矩陣,這對于一些存儲空間有限的嵌入式應用非常適合。
特征比對
特征比對主要是比較兩張不同人臉間的相似度,最有效的方法即是利用特征間的相關度作為相似度的描述,在識別人臉的時候,待識別圖像與特征庫中的所有特征進行比對,其相似度最大者即為匹配結果。
未來應用將更廣泛
人臉識別技術在國內(nèi)被認為是“早上八九點鐘的太陽”,已經(jīng)成功應用到金融、軍工等多個領域,行業(yè)發(fā)展優(yōu)勢明顯,基于現(xiàn)階段的技術與市場現(xiàn)狀,人臉識別的發(fā)展前景十分樂觀。
就技術發(fā)展角度來說,首先,人臉識別技術及產(chǎn)品應用將從“室內(nèi)”走向“室外”。目前,由于受到光線等因素的制約,人臉識別產(chǎn)品在室內(nèi)應用時具有較高的識別率,一旦暴露在陽光下,識別性能將受到一定程度的影響。近年來,國內(nèi)在這一方面有了較大的發(fā)展,預計至2010年,這一技術壁壘將得到有效緩解,人臉識別應用范圍將進一步擴大。
另外,人臉識別將由“配合式技術”向“非配合式技術”發(fā)展。現(xiàn)階段的人臉識別門禁,需要用戶對準識別機端正姿勢,才能識別成功,而隨著技術的發(fā)展和算法的成熟,識別角度對于識別率的影響將大大降低。特別是在智能視頻監(jiān)控系統(tǒng)廣泛應用的今天,“非配合式技術”的發(fā)展對于有效的在視頻中捕捉關鍵人物信息提供了強有力的支持。諸多案例已經(jīng)證明,傳統(tǒng)的“盯人式”監(jiān)測手段已經(jīng)無法適應新環(huán)境下的安防需求,而相對于傳統(tǒng)穩(wěn)定的固定式人臉識別來說,運用監(jiān)控攝像頭在對被監(jiān)控者進行“無形”的識別,具有更為深遠的意義。就目前的發(fā)展情況分析,這一技術也會在近幾年取得不錯的發(fā)展,那時的人臉識別也將變得更加自然。
此外,人臉識別專用芯片的研發(fā)工作也已經(jīng)適時展開,與現(xiàn)階段的通用芯片相比,人臉識別產(chǎn)品的穩(wěn)定性和成熟度將得到最大程度的提升,并大大降低現(xiàn)有產(chǎn)品的成本和功耗,人臉產(chǎn)品的使用門檻也將大大的降低,從而加速人臉識別產(chǎn)業(yè)化的發(fā)展進程。
伴隨技術的不斷創(chuàng)新,人臉識別應用領域會更加廣闊,民用市場極有可能成為這場安防革命的生力軍之一。目前,已有多家國內(nèi)知名防盜門廠商與人臉識別技術提供商取得聯(lián)系,就人臉識別技術嵌入式家用防盜門展開合作。也許在不久的將來,人們將與鑰匙徹底告別,而迎來人臉開門的新時代。另外,到2010年,國家航空組織可能將人臉識別運用到其電子簽證上;而大型的考生驗證系統(tǒng)也是人臉識別將來有望大展拳腳的領域。可以預見,一旦打開這個“缺口”,不僅能夠直接刺激人臉識別市場的發(fā)展,對于人臉在其他領域的應用也將變得更加容易。(本文由漢王科技股份有限公司人臉識別事業(yè)部總經(jīng)理石踐提供)