人臉圖像預處理技術
人臉圖像預處理是基于人臉檢測結(jié)果,對圖像進行處理并最終服務于特征提取的過程。系統(tǒng)獲取的原始圖像由于受到各種條件的限制和隨機干擾,往往不能直接使用,必須在圖像處理的早期階段對它進行灰度校正、噪聲過濾等圖像預處理。對于人臉圖像而言,其預處理過程主要包括人臉圖像的光線補償、灰度變換、直方圖均衡化、歸一化、幾何校正、濾波以及銳化等。
圖像是人類獲取信息、表達信息和傳遞信息的重要手段。利用計算機對圖像進行去除噪聲、增強、復原、分割、提取特征等的理論、方法和技術稱為數(shù)字圖像處理。
數(shù)字圖像處理技術已經(jīng)成為信息科學、計算機科學、工程科學、地球科學等諸多方面的學者研究圖像的有效工具。數(shù)字圖像處理主要包括圖像變換、圖像增強、圖像編碼、圖像復原、圖像重建、圖像識別以及圖像理解等內(nèi)容。數(shù)字圖像的邊緣檢測是圖像分割、目標區(qū)域識別、區(qū)域形狀提取等圖像分析領域十分重要的基礎,也是圖像識別中提取圖像特征的一個重要屬性,邊緣檢測算子可以檢查每個像素的鄰域并對灰度變化率進行量化。
空域濾波按照空域濾波器的功能又可分為平滑濾波器和銳化濾波器。平滑濾波器可以用低通濾波實現(xiàn),目的在于模糊圖像或消除噪聲;銳化濾波器是用高通濾波來實現(xiàn),目的在于強調(diào)圖像被模糊的細節(jié)。
光照不理想的情況下,為了把人臉區(qū)域從非人臉區(qū)域分割出來,需要使用適合不同膚色和不同光照條件的可靠的膚色模型。常用的RGB表示方法不適合于皮膚模型,在RGB空間,三基色(R、G、B)不僅代表顏色,還表示了亮度。由于周圍環(huán)境光照的改變,亮度可能使人臉的檢測變得更加復雜,在皮膚的分割過程中是不可靠的。為利用膚色在色度空間的聚類性,需要把顏色表達式中的色度信息與亮度信息分開,將R、G、B轉(zhuǎn)換為色度與亮度分開的色彩表達空間可以解決這個問題。
RGB色彩系統(tǒng)用R、G、B三種基本顏色分量來表示數(shù)字圖像像素的顏色值。我們非常熟悉的計算機屏幕的顯示通常采用RGB色彩系統(tǒng)。這是最常見的色彩系統(tǒng),RGB色系坐標中三維空間的三個軸分別與紅、綠、藍三基色相對應,原點對應于黑色,離原點最遠的頂點對應于白色,其他顏色落在三維空間中由紅、綠、藍三基色組成的彩色立方體中。其他的色彩系統(tǒng)常以RGB色彩系統(tǒng)為基礎,其分量可以描述為RGB三色的線性或非線性函數(shù)。RGB色彩系統(tǒng)通過色彩的相加來產(chǎn)生其他顏色,通常稱為加色合成法。
當光照條件發(fā)生變化時,人臉的顏色也會發(fā)生一定的變化。實驗表明,當待檢測的圖像亮度高于訓練圖像的亮度時,人臉大部分區(qū)域的顏色不會超過正常光照條件下人臉顏色的變化范圍。但當待檢測的人臉圖像的亮度低于訓練樣本圖像的亮度時,人臉顏色很可能超出正常光照條件下人臉顏色的變化范圍。為了解決這一問題,就要對待檢測的人臉圖像進行光線補償。光線補償對于畫面較暗的圖像很有效,能極大提高后續(xù)膚色建模的效果。對于光線較暗的圖片進行光線補償可以很好地提高人臉膚色建模的效果。
在運動場景下,多數(shù)時候會抓拍到的只有半張臉的圖片,使用對稱補值的方式,能有效地為下一步特征提取補齊整張人臉的最低特征值,并進行有效識別;對于動態(tài)識別場景,往往出現(xiàn)人臉信息不全的情況,特別是對于疑犯等,都存在故意壓低頭或者側(cè)臉方式行走,避免被監(jiān)控抓拍到全臉的情況;使用半臉對稱補值方式,有效地解決了此場景問題。
在一系列的預處理后,人臉識別的最終準確率及效率得到大幅度提升,且能適用更多的應用場景,對于原始已建設的安防系統(tǒng),不需要二次的改造,不僅節(jié)約成本,也解決實際問題。