「2018中國人工智能安防峰會」雖然已經結束了一段時間,但眾多AI+安防界重量嘉賓登臺發(fā)表演講,讓人受益匪淺。本文,筆者對阿里達摩院機器智能技術實驗室副主任華先勝的演講進行了要點整理,以最精華的觀點,供行業(yè)人士參考。
華先勝,北京大學應用數學博士、IEEE Fellow、ACM2015年度杰出科學家、MIT TR全球35位35歲以下的杰出青年創(chuàng)新人物,曾擔任ACM Multimedia等大會程序委員會主席,是視覺識別和搜索領域的國際級權威學者。于2016年7月加入阿里人工智能研究機構iDST科學家團隊,帶領視覺計算團隊的研發(fā)工作。
阿里達摩院機器智能技術實驗室副主任華先勝
演講要點整理:
從人工智能的角度以及從人工智能從業(yè)多年的技術人員的角度來看安防問題,能帶來一些新的思考。以下結合阿里團隊近兩年與交警、公安一起摸爬滾打出來的技術點、應用場景和系統(tǒng)的感悟,希望給大家?guī)硇碌膯⑹尽?/p>
兩年前阿里提出“城市大腦”市場幾乎無人問津,但現在市場卻有更多的企業(yè)在標榜自己是做城市大腦的。阿里之所以提出這一概念是看到AI技術的發(fā)展、算力的提升和數據超大規(guī)模的匯聚,于是誕生了能否為城市安裝一個大腦,去挖掘城市的價值的想法,它的實質是不斷進展的AI技術和逐步增長的強大的計算能力,挖掘城市里面大量的異構數據的不可替代的價值。這個價值可以體現在數據智能助力城市管理與服務,全面、實時、全面的優(yōu)化和干預,帶來的便捷和靈活。往上提一個層次就是城市管理領域、服務領域的突破和產業(yè)發(fā)展領域的突破,再往上提一層便是城市的安全管理。
現在城市的管理是怎樣的?也許從事安防的我們都很清楚:
第一點是盲人摸象,雖然我們有很多單點、局部的交通和安防的感知點,但卻存在較多損壞的設備,雖然覆蓋最大量視頻監(jiān)控點,投入大量的財力去建設視頻的攝像頭,但這部分的資源遠遠沒有真正利用起來,現在更多的是集中在交通處罰、事后斷案的階段,攝像頭的價值遠遠不止這些;
第二點是燈下黑,早期建設的攝像頭并沒有智能功能,就算從今天看智能攝像頭也僅僅是小部分,而且智能也是有限的。當前如何利用這些攝像頭把它的效能發(fā)揮出來,僅僅依靠人工基本無法實現;
第三點是霧里看花,所有的設備是單點,無法發(fā)現一些現象和問題背后的真實原因。
在這樣的背景下,阿里希望能把城市各種各樣的數據聚合起來,發(fā)掘它的價值,尤其是視頻的數據。但從這個項目提出后,不管是公司內部還是外部,面臨著大量的挑戰(zhàn),直至今天依然存在??偨Y起來,挑戰(zhàn)可以歸整為三個部分,一是投入,我們需要處理整個城市幾萬路、幾十萬路的視頻,不管是計算、帶寬的投入,還是算法及研發(fā)的投入,二是價值,我們能從這些數據中挖掘出什么價值,是錦上添花還是需要我們自身去創(chuàng)造需求,三是與傳統(tǒng)講的視頻監(jiān)控、智慧城市又什么不一樣,差別在哪里。
通過對城市數據(GPS、線圈、公交、微波等)的感知,從而進行決策優(yōu)化、預測,最后進行干預或預防,實現整個城市級別的全局智能,阿里把這樣一套系統(tǒng)叫做城市的大腦。目是以交通和安全兩個領域為重要的應用場景,當然未來可能還會在其它的領域進行探索,如環(huán)保、能源、土地使用等等領域都會匯集到這個大的領域里來,甚至是規(guī)劃都會匯集到這個大腦里面來。
在感知層上,城市的感知經歷了無感無知(想知道發(fā)生了什么,需要向別人了解)、感而不知(城市攝像頭需要大量人工操作)、感而略知(攝像頭擁有智能功能)等階段,今天城市管理者希望城市要做到感而全面知、感而全量知、感而實時知。
隨著算力的提成,我們不僅能實現對道路情況的全面感知,還能實現對人、車燈進行全面的感知,甚至也要在質量很差的視頻中,算法做到高精度、高速度、高性能地感知。平時車流正常通行的時候,數據是大量的,異常的數據是較少的,我們?yōu)檎5氖虑榻?,異常的事情進來的時候,它就會有明顯的反應。
在杭州城市大腦中,以下案例值得分享給大家,例如機器交警巡邏,當前城市的攝像頭主要有兩大類,一是槍機二是球機,后者往往沒有多少智能功能,阿里的工作就是要讓大量的球機變得智能,不管是交通違法還是交通事故,都可以通過它進行監(jiān)控,通過實時監(jiān)控,能讓城市管理者可以快速預測到城市異常狀況。
這個工作有一個特點,就是充分利用城市既有的監(jiān)控設施發(fā)揮它最大的效率,不需要再安裝一個攝像機,不管你的視頻的質量怎么樣,阿里都可以解決問題??赡芎芏嘧鰯z像機的廠商會不愿意看到這樣的技術出現,但確實我們是做到了。
在杭州城市大腦的實踐中,阿里在不增加外場設備,不改變現有鏈路的情況下,通過視覺云上的計算,使得設備的能力得到很大的提升?,F在阿里也在做AI芯片的線上測試,會進一步減少計算的消耗,提升更高的處理能力。
剛才講的是感知層。再往后就是搜索和挖掘,這是實時進行處理的。我們在互聯網上找東西可以通過搜索引擎來找,如果城市的管理者要找城市發(fā)生的事情,可以通過城市的搜索引擎來找,我們把城市里看到的人、車、路、物、事等全部放到搜索引擎里去。
做這件事情有兩大挑戰(zhàn),第一個挑戰(zhàn)是系統(tǒng)的挑戰(zhàn),也就是說要去索引那么大量的數據,怎么能夠讓索引的搜索足夠快,但這是阿里擅長的。第二個是用什么方式去描述我們關心的這些對象,關心的那個車和那些東西,當然也可以用結構化的信息來做,這個車是什么顏色、什么牌子,這個人是男是女等等。今天阿里可以用特征的方式來識別,它是一串數字,這串數字就代替了你所關心的這輛車、這個人的特征,阿里通過這個特征進行目標的索引和檢索。怎么樣找這個合適的特征,怎么樣把一個圖片,一個目標變成一個特征,這是核心的課題,這里面有很多的方法,阿里可以通過學習的方法,通過神經網絡、目標函數的設計,可以逼迫神經網絡收斂到我們想要去的地方,從而使它表達出我們想要表達的方法。
接下來是預測,雖然我們無法預測某個個體的行為,但是我們可以預測整體的趨勢,我們在蘇州做了這樣的實驗,預測車流在20分鐘、30分鐘后的變化。
今天的GPS導航,其實是沒有幫你做車流預測的,它僅僅是根據當前的車流給你選擇一個最優(yōu)路線,所以經常會走著走著它給你建議不同的路線,因為交通狀況在變化。但如果我們有預測,GPS的路徑規(guī)劃就可以做得更好,如果時間更長的話,還可以進行更好的干預。這里面我們用深度學習的方法預測下一時刻的交通狀況,這在蘇州得到了很好的預測。
城市大腦的不同之處,第一是用大量異構城市數據中通過大規(guī)模計算和AI,挖掘其不可替代的價值。第二,城市大腦是在做人的智能不能完全的事情,因為它的復雜度、計算量已經沒有辦法用人力來完成,比如說紅綠燈的配置、眾多球機的檢測無法通過人力完成,我們要通過城市大腦完成人不能完成的事情。我們經常講人工智能有的地方是超越人的,有的地方是遠遠不如人的,但在這個地方它是超越人的。第三,城市大腦還希望將來能成為一個城市的基礎設施,就像水電煤一樣。
深度學習、數據、計算能力使得AI有了發(fā)展,這個發(fā)展使得我們思考能不能為城市建造一個大腦,挖掘城市的價值,改變這個城市,改變我們在城市里的生活方式。由于這個城市的環(huán)境、城市的平臺是非常獨特的,它的數據的量、計算的需求,問題的復雜性、它對價值挖掘需求的量和迫切性使得城市可以成為一個平臺,或者說城市大腦可以成為一個平臺,去孵化更多的技術,有更多的創(chuàng)新在這個平臺上能夠發(fā)掘出來,使得一些科研的技術、實驗室的技術在這個平臺上得到錘煉,得到扎扎實實的實現。這也是為什么城市大腦會被科技部選為首批四個國家人工智能開放創(chuàng)新平臺之一的原因。
(本文為筆者根據現場速記整理,如有錯漏,以官方媒體報道的為準)