視頻分析(video analyzing)是用計算機(jī)從視頻中通過運(yùn)算和分析,提取視頻中有用信息的一項技術(shù)。對計算機(jī)來說,視頻圖像只是一個數(shù)據(jù)數(shù)列,一個包含每一幀每一個像素點的灰度值或彩色值的數(shù)列,其目標(biāo)信息包含在那些像素點的值所組成的平面圖像序列中,是需要從“整體”上進(jìn)行“理解”才能獲得的。而視頻分析技術(shù)便是通過特定的核心算法程序提取視頻信號中所包含的內(nèi)容信息或個體運(yùn)動信息,以實現(xiàn)計算機(jī)對于視頻的理解—— “明白”視頻中所展現(xiàn)的內(nèi)容或者發(fā)生的的事情,即“事件”。
視頻分析技術(shù)范圍很廣,只要是從視頻中通過運(yùn)算處理,提取有用信息的方式都可稱作視頻分析技術(shù)。目前發(fā)展相對成熟并形成產(chǎn)品投入實際項目應(yīng)用的技術(shù),如車牌識別技術(shù)、視頻檢索技術(shù)、視頻人臉檢測等,皆可歸為“視頻分析技術(shù)”。嚴(yán)格來講,這類技術(shù)原本只是視頻分析技術(shù)中較為粗淺的一部分,不過由于它們已被較好地挖掘和應(yīng)用,出現(xiàn)一些專門的稱謂,才被單獨提了出來。當(dāng)前,通常所說的視頻分析技術(shù)一般特指從視頻中目標(biāo)運(yùn)動行為的分析、提取和識別,它常用于安防監(jiān)控領(lǐng)域,其所指稱的范圍比之字面含義已有大幅縮小。
視頻分析技術(shù)運(yùn)作流程是:首先使得計算機(jī)知道視頻中“發(fā)生的是什么事”,再將其與對應(yīng)的規(guī)則相比對和判斷,由此計算機(jī)即可斷定事件的特性。從視頻中個體運(yùn)動行為的分析、提取和識別角度來看,即令計算機(jī)判斷出這些個體進(jìn)行了一些什么行為,進(jìn)而能夠判斷這些行為是否符合某些規(guī)則,是否屬于“某一類型”的行為。一旦出現(xiàn)的行為或事件不符合相應(yīng)的規(guī)則,即刻發(fā)出告警信息,從而擺脫人工的干預(yù)和判斷,實現(xiàn)令計算機(jī)“代替”人進(jìn)行監(jiān)控,也即實現(xiàn)了自動監(jiān)控或“智能監(jiān)控”。
實際上,智能視頻分析技術(shù),起源于計算機(jī)視覺技術(shù)。計算機(jī)視覺(ComputerVision)技術(shù),是人工智能(ArtificialIntelligent)研究的分支之一,它能夠在圖像及圖像描述之間建立映射關(guān)系,從而能夠通過數(shù)字圖像處理和分析來理解視頻畫面中的內(nèi)容。計算機(jī)視覺技術(shù)可分為低層視覺技術(shù)(Low-level Vision)與高層視覺技術(shù)(High-level Vision)。低層視覺技術(shù)要解決特征提取、運(yùn)動檢測、多目標(biāo)根蹤等基本問題;高層視覺技術(shù)要解決對場景的語義理解,如目標(biāo)運(yùn)動軌跡的判別,異常行為異常事件的最終結(jié)論等。因此,在計算機(jī)視覺領(lǐng)域中,一個最根本的問題就是如何從底層原始視頻數(shù)據(jù)得到高層的語義理解,而智能視頻監(jiān)控技術(shù)中的智能視頻分析技術(shù)的研究正是緊緊圍繞這個基本問題,其研究范圍不是僅局限于某個特定問題,而是涉及到計算機(jī)視覺中從底層到高層的許多基本問題。
智能視頻監(jiān)控技術(shù)主要是對視頻自動進(jìn)行分析,從視頻中提取關(guān)鍵信息,發(fā)現(xiàn)與識別異常的感興趣事件,從而可以替代人為監(jiān)控或者協(xié)助人為監(jiān)控。顯然,視頻分析與識別涉及到復(fù)雜的軟件算法,它可以通過編程識別出奇怪與異常的行為。視頻內(nèi)容分析與識別軟件能通過分析現(xiàn)場或記錄的視頻流,檢測識別出可疑的活動、事件或者行為模式。視頻監(jiān)控系統(tǒng)的智能化是指在不需要人為干預(yù)的情況下,系統(tǒng)能自動實現(xiàn)對監(jiān)控畫面中的異常情況進(jìn)行檢測、識別,并及時作出預(yù)/報警。
視頻分析技術(shù)通常采用背景減除技術(shù)來進(jìn)行圖像變化的檢測(如入侵、丟包、逆行等都是一種模式的圖像變化),即對視頻幀與基準(zhǔn)背景圖像進(jìn)行比較,相同位置的像素(區(qū)域)變化則認(rèn)為是變化了的區(qū)域,對這些區(qū)域進(jìn)一步處理、識別、跟蹤,得到包括目標(biāo)位置、尺寸、形狀、速度、停留時間等基本形態(tài)信息和動態(tài)信息,完成目標(biāo)的跟蹤和行為理解之后,也就完成了圖像與圖像描述之間的映射關(guān)系,從而使系統(tǒng)進(jìn)一步進(jìn)行規(guī)則判定,直到觸發(fā)報警。
目前,普遍使用的運(yùn)動目標(biāo)檢測方法就是背景減除法,其算法雖較簡單,但仍然會受到光線、天氣等自然條件及背景自身變化(海浪、云影、樹葉搖動等情況)的影響。針對不同的天氣以及自然干擾,已應(yīng)用有多種附加算法(過濾器)來彌補(bǔ)這些干擾。隨著光電圖像處理技木及微電子技術(shù)的發(fā)展,相信智能視頻分析技術(shù)會進(jìn)一步成熟。
從廣義上來說,也可以把智能視頻分析技術(shù)分為如下三類。
視頻分析類
該類主要是在監(jiān)控圖像中找出目標(biāo),并檢測目標(biāo)的運(yùn)動特征屬性。如目標(biāo)相對的像素點位置,目標(biāo)的移動方向及相對像素點移動速度,目標(biāo)本身在畫面中的形狀及其改變。根據(jù)以上的基本功能,視頻分析可分為以下幾個功能模塊。
· 周界入侵檢測、目標(biāo)移動方向檢測;
· 目標(biāo)運(yùn)動、停止?fàn)顟B(tài)改變檢測;
· 目標(biāo)出現(xiàn)與消失檢測;
· 人流量、車流量統(tǒng)計;
· PTZ自動追蹤系統(tǒng);
· 系統(tǒng)智能自檢功能等。
視頻識別類
該類包括人臉識別、步態(tài)識別與車牌識別,其主要技術(shù)是在視頻圖像中找出局部中一些畫面的共性。如人臉必然有兩個眼睛,如果可以找到雙目的位置,那么就可以定性人臉的位置及尺寸(在現(xiàn)有技術(shù)條件下,人臉識別系統(tǒng)必須在雙目可視的情況下,才可進(jìn)行人臉比對)。視頻識別類其主要包括。
· 人臉識別系統(tǒng);
· 步態(tài)識別系統(tǒng);
· 車牌識別系統(tǒng);
· 照片比對系統(tǒng);
· 工業(yè)自動化上的零件識別即機(jī)器視覺系統(tǒng)等。
視頻改善類
該類主要是針對一些不可視、模糊不清,或者是對振動的圖像進(jìn)行部分優(yōu)化處理,以增加視頻的可監(jiān)控性能。具體包括。
· 紅外夜視圖像增強(qiáng)處理;
· 車牌識別影像消模糊處理;
· 光變與陰影抑制處理;
· 潮汐與物體尺寸過濾處理;
· 視頻圖像穩(wěn)定系統(tǒng)等。