二、圖像識(shí)別在垂直安防行業(yè)的成果
1、已經(jīng)成熟的車輛識(shí)別
現(xiàn)在下面是利用深度學(xué)習(xí)算法開發(fā)的車輛大數(shù)據(jù)結(jié)構(gòu)化引擎。
從畫面可以看到每個(gè)交通單元中,無論是機(jī)動(dòng)車還是非機(jī)動(dòng)車都可被檢測(cè)與跟蹤,對(duì)應(yīng)每一個(gè)目標(biāo)的屬性也會(huì)被識(shí)別出來:可以檢測(cè)出車牌號(hào)碼、生產(chǎn)商、型號(hào)、年檢標(biāo)的狀態(tài),甚至具體是哪個(gè)年份的型號(hào)也可以被識(shí)別出來。
車輛識(shí)別問題在今天看來已經(jīng)被解決了,車輛是一種非常特殊的目標(biāo),因?yàn)樗兄粋€(gè)獨(dú)一無二的ID:車牌號(hào)碼。合法車牌號(hào)碼具有唯一性,一旦把車牌號(hào)碼識(shí)別出來整個(gè)問題就比較好解決。
從去年開始,車輛大數(shù)據(jù)產(chǎn)品已被很多廠商推出,未來也會(huì)越來越普及。
這里面有一個(gè)重要的機(jī)遇,道路上客戶的攝像頭分3種:電警、卡口、監(jiān)控?cái)z像頭。
所謂電警和卡口,通常是在十字路口或者高速公路的進(jìn)出口上搭了一個(gè)龍門架,或者有一個(gè)裝了攝像頭的架子。
這些攝像頭使用了很高的分辨率,角度也非常合適,它可以在正面增加識(shí)別的成功率。但是像電井和卡口這樣的攝像頭,它只占整個(gè)道路周邊攝像頭數(shù)量的很小一部分。以北京為例,電警和卡口攝像頭的數(shù)量占道路全部攝像頭數(shù)量的千分之一左右。
還有更多攝像頭是普通的視頻監(jiān)控?cái)z像頭,這些攝像頭數(shù)量很多,分辨率也不是特別高,因?yàn)樗鼈円浿埔曨l。一般在安裝的時(shí)候都是為了監(jiān)控整個(gè)大場(chǎng)景,所以視場(chǎng)角較大,視場(chǎng)角變大的壞處就是針對(duì)每一個(gè)目標(biāo)它所能夠分配的像素?cái)?shù)量會(huì)降低。
這個(gè)時(shí)候,監(jiān)控視頻里看到很多目標(biāo)并不是很清晰:沒有補(bǔ)光、照明不夠、圖像模糊現(xiàn)象很嚴(yán)重。如何在這種低質(zhì)量的數(shù)據(jù)、不理想的環(huán)境下仍然把視頻識(shí)別做好?這在某些方面決了定我們能否把道路監(jiān)控大視頻、大數(shù)據(jù)這個(gè)事情做好,這一領(lǐng)域的產(chǎn)品其實(shí)還有很多的改進(jìn)空間。
當(dāng)基礎(chǔ)數(shù)據(jù)被識(shí)別出來后,基于這些數(shù)據(jù)就可做各種各樣的大數(shù)據(jù)分析。以格靈深瞳為例,我們開發(fā)了一個(gè)車輛大數(shù)據(jù)的平臺(tái)叫威目視圖大數(shù)據(jù)分析平臺(tái)。
給大家做一個(gè)非常簡(jiǎn)單地演示,我們?cè)诳蛻舻默F(xiàn)場(chǎng)選擇了一些攝像頭,之后選擇一個(gè)區(qū)域。然后就可以搜索一些不同品牌的車,比如奧迪、寶馬等等。在搜索“奧迪”之后,你可以選擇其中任何一輛車然后看看它出現(xiàn)在了什么地方、什么時(shí)間,隨后可在地圖里做進(jìn)一步搜索。
大家可以想象,當(dāng)我在一個(gè)空間里能夠得到很多搜索結(jié)果時(shí),這些不同結(jié)果的時(shí)空關(guān)系會(huì)為我們提供一個(gè)軌跡信息。這些軌跡信息會(huì)給我們更強(qiáng)有力的分析手段去分析一些人的行為,這里面有各種各樣的戰(zhàn)法,所謂戰(zhàn)法就是警方客戶在破案或在分析一些數(shù)據(jù)時(shí)采用的一些不同的手段和流程。
2、人物屬性識(shí)別
剛才是車,我們現(xiàn)在來看一下關(guān)于人的識(shí)別。
這套視覺系統(tǒng)能夠?qū)Ξ嬅胬锏男腥撕退膶傩越Y(jié)構(gòu)化,也就是對(duì)人物的基本屬性做一些判斷:如性別、大致年齡、行李屬性、衣服顏色、衣服類型。如果可以看到正面的話,就可以看清他的有沒有戴口罩和戴眼鏡,有沒有留胡子等信息。
這些信息其實(shí)跟人臉識(shí)別不太一樣,它是一種短效、對(duì)分辨率要求不高時(shí)得到信息的一種途徑。
當(dāng)我們很多人對(duì)安防監(jiān)控不熟悉的話,就會(huì)覺得街頭上的安防監(jiān)控?cái)z像頭一定會(huì)把人臉識(shí)別出來。但事實(shí)上,今天絕大多數(shù)普通的安防監(jiān)控?cái)z像頭根本不可以滿足人臉識(shí)別分辨率的條件。
首先它們的視場(chǎng)角往往設(shè)置的比較廣,第二是他們離人的距離比較遠(yuǎn)。
在這種情況下,雖然可以看清這個(gè)人的外形,但要想看清他的面部,尤其想在面部區(qū)域得到一個(gè)比較高的分辨率,至少是80×80,或是100×100,分辨率高是提升人臉識(shí)別效果非常重要的因素。
當(dāng)今街道上這些普通監(jiān)控?cái)z像視頻里面,雖然看不清臉,無法做人臉識(shí)別,但是我們?nèi)绻軌驈乃砩系玫剿钠渌麑傩裕彩呛苤匾脑亍?/p>
舉一個(gè)例子,比如有一個(gè)小孩走失了,目擊證人提供的線索是看到一個(gè)穿著紅顏色衣服的中年婦女抱著這個(gè)孩子。那么我們就可以根據(jù)上述提到的屬性去搜索:中年、女性、紅色衣服、抱著孩子,把這4個(gè)特征輸?shù)剿阉飨到y(tǒng)當(dāng)中,即可迅速地找到目標(biāo)。
3、人臉識(shí)別
我們?cè)賮砜聪氯四樧R(shí)別,要想得到一個(gè)比較靠譜的識(shí)別結(jié)果,畫面的距離如下圖展示的這樣。
在這里,我們聯(lián)通了一個(gè)普通的高清攝像頭。在這個(gè)攝像頭中我們特地選擇了一個(gè)焦距比較長(zhǎng),為15毫米以上的鏡頭放在一個(gè)辦公室的走廊頂端。我們發(fā)現(xiàn),環(huán)境里差不多有效識(shí)別人臉的寬度最多為三米。當(dāng)然也可以使用一些更長(zhǎng)焦的鏡頭把識(shí)別寬度推到更遠(yuǎn)的地方,或用短鏡頭把識(shí)別寬度放在離相機(jī)比較近的地方。但是無論你怎么試,它真正有效的識(shí)別寬度也就三米左右。
通常我們得到一張低分辨率的人臉,比如說30×30以下,那么它在一個(gè)很大的數(shù)據(jù)庫里去做搜索的效果,肯定非常不理想。通常要求一個(gè)人臉最好是達(dá)到100×100個(gè)像素以上時(shí),它的搜索結(jié)果就會(huì)非常精確,甚至可以在一個(gè)很大,如幾百萬、幾千萬人的數(shù)據(jù)庫里做有意義的搜索。
人臉識(shí)別技術(shù)在過去幾年進(jìn)展非常大。和3年前相比,我們?nèi)タ匆粋€(gè)標(biāo)準(zhǔn)測(cè)試集時(shí),錯(cuò)誤率可能已經(jīng)小了上千倍。我們訓(xùn)練人臉模型時(shí),尤其要注意光照、角度、表情問題,能不能夠去抗干擾。
視頻中大家也可以看到,人員自己去做一個(gè)挑戰(zhàn),每一位員工在工作期間無論在辦公室里還是在外面的院子,都能被我們的人臉識(shí)別系統(tǒng)拍到很多照片。
我故意讓他們走到攝像頭跟前來做鬼臉,看看誰可以把臉做如此夸張以至于人臉識(shí)別系統(tǒng)會(huì)產(chǎn)生錯(cuò)誤的識(shí)別。大家可以看到有一些人在做鬼臉,有些人在弄亂自己的發(fā)型。