a&s專業(yè)的自動化&安全生態(tài)服務(wù)平臺

公眾號

安全自動化

安防知識網(wǎng)

手機(jī)站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應(yīng)用搜索

首頁 > 資訊 > 正文

格靈深瞳趙勇：AI將如何影響和變革安防行業(yè)？

作者：趙勇 2017-03-13 16:25 閱讀 3553 來源：格靈深瞳評論區(qū)

前沿生物視覺技術(shù)在安防領(lǐng)域的應(yīng)用

　　六、前沿生物視覺技術(shù)在安防領(lǐng)域的應(yīng)用

　　接下來我給大家分享一些在安防領(lǐng)域里面落地的前沿且有趣的技術(shù)。

　　大自然是一個(gè)非常豐富的知識庫，我們可以從里面學(xué)到很多知識。計(jì)算機(jī)視覺是關(guān)于“視覺”的，所以我們來關(guān)注一下人的眼睛以及動物的眼睛。

　　從眼睛模型中我們可以看到它有個(gè)“快門”，也就是所謂的瞳孔，“鏡頭”是我們眼睛的晶狀體，“傳感器”則是眼球里面的視網(wǎng)膜。

　　其實(shí)人的眼球跟數(shù)碼相機(jī)本質(zhì)上沒有特別大的差別，但相機(jī)實(shí)際上已發(fā)明100多年，今天我們的相機(jī)無論是很貴的數(shù)碼單反還是iPhone上的相機(jī)，它其實(shí)和1839年發(fā)明的第一臺相機(jī)在成像原理上沒有本質(zhì)的不同。不過是通過小孔成像原理，把真實(shí)的物體通過倒影呈現(xiàn)在背景的傳感器上。這么多年唯一發(fā)生變化的就是鏡頭變得越來越好了，傳感器變得越來越好了。但是在這個(gè)過程中呢，成像的基本原理還只是一個(gè)投影問題。

　　1、怎樣解決三維變二維時(shí)丟失的距離信息

　　我們的世界是一個(gè)三維世界，每一個(gè)物體都是三維的，它投影的結(jié)果是在一個(gè)平面上，無論它是相機(jī)底片平面，還是眼球的球面。最終還是變成了一個(gè)兩維的數(shù)據(jù)，在這個(gè)過程中三維壓縮到兩維，丟失了什么嗎?丟失的是深度信息，也就是縱深方向距離的信息。

　　我再給大家舉個(gè)例子，比如幾輛汽車放在一起，與此同時(shí)有一輛玩具車被一個(gè)人拿在手里，如果不是因?yàn)檎掌锏氖种?，很多人都誤以為這就是停車場上的一輛真車。你可以看到圖像里物體真實(shí)的大小不代表它的實(shí)際大小。最近這輛紅色的跑車其實(shí)是很小的，可是遠(yuǎn)處一輛在樹背后的車看上去很小，但實(shí)際上真實(shí)車的尺寸比較大。一個(gè)物體在圖像中的尺寸跟他的真實(shí)尺度不一定有什么關(guān)系，當(dāng)你失去了尺度，就沒辦法衡量尺寸、距離、速度、加速度。這種情況下，我們?nèi)シ治鑫矬w的行為就有了很大的問題。

　　我們再來看一個(gè)自然界的現(xiàn)象，這里顯示了一些動物照片，這些動物都有共同特點(diǎn)：都有兩個(gè)眼睛。而且兩個(gè)眼睛都有比較大的視場角重疊，大家有沒有意識到所有捕食動物的眼睛都朝前長的，所以他們兩個(gè)眼睛的視野重疊比較大，重疊最大的好處是可通過兩個(gè)眼睛對圖像的視差的分析，能夠計(jì)算出這個(gè)目標(biāo)的深度，有了深度以后就可以去追捕他。

　　而所有被捕食的動物，比如羊、駱駝、馬的眼睛都長到了側(cè)面，然后形成了一個(gè)360度的全景。它最大的優(yōu)勢就是可以更有效地去防范周圍的捕食者，它可一邊吃草，一邊看腦袋后面有沒有捕食者在靠近。

　　其實(shí)在計(jì)算機(jī)視覺領(lǐng)域，就有很多技術(shù)可以利用多視場能夠計(jì)算出來物體的深度。

　　格靈深瞳根據(jù)這種原理推出一款名為皓目行為分析儀的產(chǎn)品，皓目行為分析儀用一種結(jié)構(gòu)光的方式生成Depth Video，然后基于數(shù)據(jù)去分析人的行為。

　　我給大家看一個(gè)簡單的展示，在這個(gè)展示里面有很多人在相機(jī)跟前走動，他們之間產(chǎn)生了很多遮擋。

　　但是即使在遮擋發(fā)生的情況下，我們?nèi)匀豢梢院芎玫匕衙恳粋€(gè)人跟蹤下來，給每個(gè)人腰上套了一個(gè)圈，這個(gè)圈有不同的顏色，畫面的左下角是一個(gè)俯視的雷達(dá)圖，雷達(dá)圖上方代表相機(jī)，下方代表它視野，然后每一個(gè)點(diǎn)它的顏色和視頻里這個(gè)人腰圈的顏色是對應(yīng)的，所以你可以看到每一個(gè)人的軌跡。通過這種方式就可在一個(gè)比較復(fù)雜的場所分析人們軌跡的行為。

　　比如說有沒有人在追逐、停留很久、徘徊，我們也可以分析人是不是摔倒了，有沒有劇烈動作等等。

　　如果要分析劇烈動作，需要對他身體的姿態(tài)動作做一個(gè)更深入地分析。在這里面我們開發(fā)了一套算法，能夠從圖像里把他的關(guān)節(jié)、胳膊、腿的位置計(jì)算出來。大家可能會意識到類似的功能在微軟或者Primesense等公司的人機(jī)交互產(chǎn)品里面實(shí)現(xiàn)過。

　　格靈深瞳則是開發(fā)了一套專門針對于安防監(jiān)控的識別算法，不同的地方是它可以在監(jiān)控視角，快速實(shí)現(xiàn)初始化比較好的工作。

　　2、昆蟲復(fù)眼原理給光場相機(jī)的啟發(fā)

　　此時(shí)有人會有質(zhì)疑，不是所有的動物都有兩只眼睛，昆蟲就不是，昆蟲的眼睛叫復(fù)眼，有幾千個(gè)鏡頭。

　　這是怎么回事呢?這組照片上顯示了很多昆蟲的眼睛，你一眼看上去的確是看到了復(fù)眼，但即使是復(fù)眼，它們也有個(gè)共同點(diǎn)，第一是它們有一對復(fù)眼，第二個(gè)是他們的眼睛針對他們的頭部來說很大。

　　為什么要長這么大的眼睛呢?作為相機(jī)來說，它的感光量是很重要的指標(biāo)。如果感光量不夠多、不夠大，很難形成清晰的照片，因?yàn)樾纬烧掌枰庾痈鷤鞲衅靼l(fā)生能量的交換。能量的交換要能夠被測量下來才能形成對顏色、亮度的識別，這就是為什么好的相機(jī)比如說單反相機(jī)它有很大的光圈。

　　但是昆蟲身子的尺寸非常小，在這種情況下為了保障進(jìn)光量，就要盡量大地增加光圈的尺寸，所以這就是昆蟲的眼睛為什么這么大。

　　第二件事情就是為什么昆蟲的每個(gè)眼睛變成了復(fù)眼?如果你要給昆蟲用傳統(tǒng)的光學(xué)模式設(shè)計(jì)眼睛，你會面臨什么挑戰(zhàn)?假設(shè)你是蜜蜂，在你的生活中要不斷去尋找鮮花采蜜，有的時(shí)候你要看到幾十里外的目標(biāo)，然后飛過去?？墒钱?dāng)你在采蜜的時(shí)候站在花瓣上要能夠看到花粉在哪個(gè)花蕊上，然后去收集它。

　　也就是說，你要既可以看到很遠(yuǎn)的物體，又能夠看到很近的物體。在這種情況下，它對變焦鏡頭的變焦動態(tài)范圍要求非常高。普通鏡頭很難做到在這樣一個(gè)范圍內(nèi)去變焦，尤其鏡頭體積還有大量的限制，這就是為何昆蟲在自然界中自然進(jìn)化出了這種形態(tài)的眼睛。

　　今天我們把這種成像模式稱作Plenoptics，簡單來說就是一個(gè)鏡頭或者傳感器陣列。這種陣列的特點(diǎn)是能夠在一個(gè)平面上去接受更大的光場，然后把光分布，包括它的方向等信息捕捉下來。廣場是四維的、光學(xué)的Representation，獲得光場之后可通過算法把不同的成像方式的結(jié)果全部計(jì)算出來。今天這種技術(shù)已經(jīng)可用來做一些有趣的產(chǎn)品。

　　比如美國加州有一個(gè)公司，他們有一個(gè)基于光場原理的相機(jī)，你在拍照的時(shí)候可以直接拍。但是你回到家以后，可對這個(gè)照片做重新聚焦的修改，也就是先拍照片，然后再去定它的焦距。

　　我們今天會發(fā)現(xiàn)，如果想要實(shí)現(xiàn)一個(gè)非常大的、動態(tài)的變焦范圍，最有效的方式就是來做光場相機(jī)。而昆蟲的復(fù)眼就是非常精確的光場相機(jī)，這是一個(gè)非常奇妙的現(xiàn)象。

　　接下來，我們來看一個(gè)例子，在這個(gè)例子是討論人臉識別的。

　　在這個(gè)畫面的左上方是2013年4月15號在波士頓發(fā)生的馬拉松暴恐案，事件爆發(fā)以后警方得到了這張照片，很顯然這張照片是從一個(gè)監(jiān)控的攝像頭上拍攝的。在這張照片里，兩個(gè)嫌疑人離鏡頭都不算太遠(yuǎn)，前面這個(gè)人可能離鏡頭有兩、三米，后面那個(gè)人大概五、六米。但我們發(fā)現(xiàn)在這么近距離的情況下兩人的面部是看不清楚的。

　　后來美國警方使用眾包的方法來尋找線索，把這張照片在電視臺上滾動播出，大概在36個(gè)小時(shí)以內(nèi)有很多馬拉松觀眾用自己的相機(jī)拍了很多照片，這些照片里面正巧有幾張拍到了嫌疑犯。在畫面右上方和左下方就是游客后來提供給警方的照片。其中左下方這張照片幫了很大的忙，因?yàn)檫@兩張照片是兩個(gè)嫌疑人，肩并肩站在一起并且正面對著鏡頭。

　　根據(jù)這張照片兩人成功被舉報(bào)，右下方3張照片是這兩個(gè)人的生活照，根據(jù)這個(gè)線索，這兩個(gè)人最終被抓住了。

　　在這個(gè)過程中，我們發(fā)現(xiàn)這么一個(gè)現(xiàn)象。今天大多數(shù)人臉識別還是卡口式的人臉識別，比如我把這個(gè)東西裝在地鐵的出口，商場入口等等，因?yàn)槿藗儽仨殢倪@些地方經(jīng)過，你就不得不被相機(jī)看到。但事實(shí)上，假設(shè)你是一個(gè)犯罪分子，如果你看到了一個(gè)相機(jī)離你這么近，那就可能不從這兒過了，或者你頭會故意低下來，讓相機(jī)看不到臉。

　　其實(shí)人臉識別的應(yīng)用必須發(fā)生在人完全不配合的場景中，他完全注意不到附近有一個(gè)攝像頭。當(dāng)他不知道附近有攝像頭時(shí)，那他被抓拍的幾率就很高。所以格靈深瞳開發(fā)的人眼相機(jī)產(chǎn)品主要是為了實(shí)現(xiàn)這個(gè)目標(biāo)，我們現(xiàn)在識別的距離可以達(dá)到50。我們自己做過一個(gè)實(shí)驗(yàn)，當(dāng)你站在一個(gè)地方，然后你要想確保你周圍50米內(nèi)都沒有一個(gè)攝像頭的話，這是比較難的一件事，因?yàn)榭臻g比較大。

　　3、人眼原理給相機(jī)的啟發(fā)

　　這是辦公室停車場的一個(gè)案例，當(dāng)格靈深瞳的人眼相機(jī)對接到了我們的動態(tài)人臉識別引擎上來，面部就會被抓取到。

　　最遠(yuǎn)的可能50米，一部分為二三十米，然后他們的面部就和員工照片庫進(jìn)行實(shí)時(shí)的比對。

　　人眼相機(jī)的原理其實(shí)和哺乳動物的眼球工作原理非常相似，人用裸眼看這個(gè)世界時(shí)是可以看得比較遠(yuǎn)，我自己在開車時(shí)發(fā)現(xiàn)一個(gè)非常特殊的現(xiàn)象，我大概可以發(fā)現(xiàn)我至少可以看到前方大概30米到50米的車牌號碼?？墒钱?dāng)我安裝了一個(gè)行車記錄儀時(shí)，我發(fā)現(xiàn)我把視頻調(diào)出來看，當(dāng)前面的車離我的距離超過八米到十米時(shí)，我就看不清這個(gè)畫面里的車牌號碼。

　　那這意味著什么?人眼的分辨率真比高清攝像頭高很多嗎?其實(shí)并不是的，只是我們的人眼的視網(wǎng)膜里有一個(gè)特殊的區(qū)域，叫黃斑。

　　黃斑非常小，尺寸有多大呢?如果你把眼球的中心跟黃斑連接起來，那么這個(gè)椎體的角度只有2.5度左右，但在這么小的一個(gè)地方，集中了人眼75%的有效像素，剩下25%的像素分散在整個(gè)160度的視場角上。一個(gè)人的單眼視場角是160度，通過一個(gè)視場角很廣但分辨率不高的一個(gè)注意力檢測系統(tǒng)和一個(gè)視場角很小但分辨率很高的黃斑系統(tǒng)共同工作，實(shí)現(xiàn)對世界的觀察。

　　我們讀書不斷地掃描每一行文字，我們開車時(shí)眼球的注意力也在不同的目標(biāo)上切換，這就是眼睛工作的原理。人眼還有一個(gè)重要特點(diǎn)，它的光學(xué)系統(tǒng)和它的識別系統(tǒng)緊密地結(jié)合在一起，并且相互反饋。在一個(gè)瞬間我們的余光注意到一個(gè)物體，如果我們認(rèn)為它重要的話，大腦就會指揮眼球轉(zhuǎn)動，把我們的黃斑會迅速聚焦在物體上面。

　　這種反饋使得眼睛非常的靈敏，人眼相機(jī)就是實(shí)現(xiàn)了光學(xué)系統(tǒng)和人的檢測，以及人臉識別系統(tǒng)接對接和反饋。從大自然的角度來講，我們發(fā)明了一個(gè)工作方式與人類眼睛一致的設(shè)備。

1 2 3 4 5 6

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請諒解！

您可能也喜歡這些文章

格靈深瞳趙勇：AI將如何影響和變革安防行業(yè)？

人臉識別技術(shù) 格靈深瞳

參與評論

回復(fù)：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達(dá)個(gè)人看法，并不表明a&s觀點(diǎn)。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團(tuán)旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗(yàn)，提供媒體、活動、展會等整合營銷服務(wù)。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責(zé)聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實(shí)后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟(jì)賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

欧美,日韩中文字幕在线,男女性杂交内射妇女bbwxz,久久99久久9国产精品免费看,久久久久无码精品国产app,免费无码成人片

格靈深瞳趙勇：AI將如何影響和變革安防行業(yè)？

前沿生物視覺技術(shù)在安防領(lǐng)域的應(yīng)用