前言:在數(shù)據(jù)即價(jià)值的大數(shù)據(jù)時(shí)代,充分挖掘數(shù)據(jù)的應(yīng)用價(jià)值成為各行各業(yè)攻堅(jiān)的熱點(diǎn),尤其在公安、交通等數(shù)據(jù)體量龐大的應(yīng)用領(lǐng)域。如何讓城市每日千億級(jí)視頻大數(shù)據(jù)實(shí)現(xiàn)實(shí)時(shí)分析并結(jié)構(gòu)化處理,以便讓基層單位和職能部門按需啟用,這是一個(gè)極具挑戰(zhàn)的難題。本次我們邀請(qǐng)到北京以薩技術(shù)股份有限公司副總裁姚巍,一起圍繞著視頻大數(shù)據(jù)的結(jié)構(gòu)化處理和融合應(yīng)用展開相關(guān)探討!
Q:a&s總經(jīng)理、總編輯關(guān)玉娟
A:北京以薩技術(shù)股份有限公司副總裁姚巍
Q:請(qǐng)簡(jiǎn)要介紹一下以薩在大數(shù)據(jù)及人工智能方面的核心業(yè)務(wù)和技術(shù)研究?
A:以薩在海量信息挖掘、分析、處理領(lǐng)域擁有十余年的技術(shù)積累,專注于人工智能、計(jì)算機(jī)視覺及大數(shù)據(jù)領(lǐng)域的技術(shù)研發(fā)及創(chuàng)新應(yīng)用,是一家以視頻人工智能為核心的多維數(shù)據(jù)融合分析解決方案提供商。主要是針對(duì)刑偵、情報(bào)、治安、反恐、交通管理等警種和部門的業(yè)務(wù)痛點(diǎn),設(shè)計(jì)研發(fā)性能領(lǐng)先、融合創(chuàng)新的公安實(shí)戰(zhàn)型系列產(chǎn)品,重點(diǎn)應(yīng)用于卡口車輛圖像大數(shù)據(jù)實(shí)時(shí)分析、全市全省級(jí)車輛圖像聯(lián)網(wǎng)應(yīng)用、重點(diǎn)車輛監(jiān)管、高危車輛實(shí)時(shí)預(yù)警、智能交通管理、視頻目標(biāo)智能分析、動(dòng)態(tài)人臉比對(duì)、移動(dòng)警務(wù)等領(lǐng)域。
Q:和行業(yè)其它技術(shù)型企業(yè)相比,以薩的技術(shù)和方案優(yōu)勢(shì)在哪里?
A:當(dāng)技術(shù)服務(wù)于公安實(shí)戰(zhàn)應(yīng)用時(shí),站在客戶視角,往往關(guān)注點(diǎn)是不同的。比如在偵查辦案過程中,除了技術(shù)算法的先進(jìn)性,用戶往往更關(guān)心技術(shù)場(chǎng)景化、規(guī)模化應(yīng)用。我們不僅不斷優(yōu)化升級(jí)算法水平,也非常關(guān)注在方案設(shè)計(jì)、架構(gòu)設(shè)計(jì)、集群調(diào)度等方面的優(yōu)化。拿視頻結(jié)構(gòu)化分析來說,以薩的視頻實(shí)時(shí)目標(biāo)分析系統(tǒng)已經(jīng)可以流暢的分析超過2800路的實(shí)時(shí)視頻監(jiān)控,這種立足于規(guī)?;瘧?yīng)用的考慮,使我們的方案在實(shí)戰(zhàn)應(yīng)用中顯得更為出色。另外,在對(duì)部級(jí)、省廳級(jí)、市縣區(qū)級(jí)不同數(shù)據(jù)量規(guī)模的項(xiàng)目中,我們積累了豐富的工程實(shí)施經(jīng)驗(yàn),交付能力非常強(qiáng)。
另外,以薩的優(yōu)勢(shì)還在于擅長(zhǎng)基于用戶需求來制定技術(shù)方案,屬于“實(shí)干派”。比如我們?cè)陂_發(fā)公安系統(tǒng)應(yīng)用時(shí),通常是面對(duì)面聽取一線辦案人員的需求,將這些需求通過技術(shù)導(dǎo)入到系統(tǒng)當(dāng)中,一點(diǎn)點(diǎn)落實(shí)高度貼合業(yè)務(wù)需求的實(shí)戰(zhàn)應(yīng)用,以能解決公安偵查辦案過程中的業(yè)務(wù)痛點(diǎn)為出發(fā)點(diǎn)。當(dāng)然這種“定制化”的系統(tǒng)在偵查辦案的效率上也有直觀的表現(xiàn),以前破案可能需要一兩個(gè)月的時(shí)間,現(xiàn)在有的案件只需要十幾分鐘就可以搞定,辦案效率提升特別快。
還有一點(diǎn),我們的系統(tǒng)在成本、性能等方面有很強(qiáng)的落地優(yōu)勢(shì)。首先在成本方面,在GPU性價(jià)比逐漸下降的當(dāng)前,以薩通過對(duì)算力資源不斷進(jìn)行優(yōu)化,極大地降低了用戶大規(guī)模部署人臉、車牌視頻實(shí)時(shí)分析應(yīng)用的成本。另外以薩也一直在提高算法的處理性能,致力于城市級(jí)視頻大數(shù)據(jù)的結(jié)構(gòu)化處理,助力數(shù)字化城市,智慧城市的建設(shè)。
Q:以薩怎么理解智慧城市和大數(shù)據(jù)?
A:有個(gè)叫“模擬城市”的游戲,這款游戲表面看是城市建模,建筑物、街道、人、車、公共設(shè)施這些元素如何在城市范圍內(nèi)進(jìn)行合理分配?其核心邏輯其實(shí)是基于數(shù)學(xué)知識(shí)通過數(shù)據(jù)精準(zhǔn)計(jì)算出來。通過游戲我們可以參考真實(shí)城市的建設(shè),在現(xiàn)實(shí)城市建設(shè)當(dāng)中,視頻數(shù)據(jù)是城市規(guī)劃主要的數(shù)據(jù)來源,我們的系統(tǒng)也會(huì)接很多其他的警務(wù)數(shù)據(jù),包括酒店、旅店、網(wǎng)吧甚至物流等領(lǐng)域的數(shù)據(jù)。這些數(shù)據(jù)是實(shí)時(shí)動(dòng)態(tài)的,通過對(duì)這些數(shù)據(jù)的采集、分析挖掘應(yīng)用,我們不僅可以針對(duì)公共安全做預(yù)警防控,其實(shí)還能基于這些數(shù)據(jù)對(duì)城市規(guī)劃、城市管理作出參考。
但有一點(diǎn)很關(guān)鍵,就是要保障數(shù)據(jù)的實(shí)時(shí)性,實(shí)時(shí)性意味著什么?一個(gè)是基于計(jì)算機(jī)視覺,系統(tǒng)能夠在毫秒級(jí)把目標(biāo)摘出來,第二是在百億級(jí)甚至千億級(jí)數(shù)據(jù)中,秒級(jí)呈現(xiàn)搜索結(jié)果。在大數(shù)據(jù)平臺(tái)上,以薩做了很多深度優(yōu)化,并結(jié)合公安實(shí)戰(zhàn)需求推出了很多快捷組件。相比于其他的平臺(tái),以薩的大數(shù)據(jù)平臺(tái)目前已經(jīng)在視頻數(shù)據(jù)的實(shí)時(shí)性上做得很透徹,兼容華為云和其他主流云平臺(tái)。通過以薩自有的快捷組件在云平臺(tái)上的高速運(yùn)算,可實(shí)現(xiàn)卓越的數(shù)據(jù)處理性能。
以薩的快捷組件是專門針對(duì)公安細(xì)微業(yè)務(wù)需求推出的專用組件,具有很強(qiáng)的針對(duì)性,比如針對(duì)車輛是否第一次進(jìn)城這種細(xì)微的應(yīng)用,在公安領(lǐng)域,像這一類細(xì)微的業(yè)務(wù)需求其實(shí)很多。我們的目的是通過深度學(xué)習(xí)技術(shù)給每一輛車、每一個(gè)人、每一個(gè)目標(biāo)物件都打上“標(biāo)簽”,即使車牌(人臉)被人為遮擋,也能通過其他的特征比對(duì)找到它,這種框架下的視頻才能發(fā)揮最大的價(jià)值。
IBM早期提出過“智慧地球”的概念,相當(dāng)于是城市大數(shù)據(jù)的雛形,我們?cè)缙谝彩艿健爸腔鄣厍颉钡挠绊?,那么,如何去?shí)踐這個(gè)概念?我們認(rèn)為首先要找準(zhǔn)行業(yè),然后再找到行業(yè)痛點(diǎn)去解決它。以薩將重心聚焦在智慧公安領(lǐng)域,公安大數(shù)據(jù)的痛點(diǎn)在哪里?首先是海量非結(jié)構(gòu)化數(shù)據(jù)的實(shí)時(shí)價(jià)值挖掘,然后是多維數(shù)據(jù)的融合,圍繞著這兩點(diǎn),以薩制定了“以視頻AI為核心的多維數(shù)據(jù)融合”的業(yè)務(wù)主基調(diào)。以前我們說“數(shù)據(jù)池”,現(xiàn)在可以稱之為“數(shù)據(jù)江”,因?yàn)閿?shù)據(jù)是實(shí)時(shí)流動(dòng)的,用戶能夠在這條“江”里高效的撈出有價(jià)值的數(shù)據(jù)信息。
Q:城市級(jí)的視頻大數(shù)據(jù)智能分析系統(tǒng)契合了哪些應(yīng)用需求?其技術(shù)框架是如何構(gòu)建的?
A: 在公安實(shí)戰(zhàn)業(yè)務(wù)中,如何在海量數(shù)據(jù)中搜集線索鎖定一個(gè)人物目標(biāo),其技術(shù)邏輯大概是這樣的:以人的身份信息為核心,通過對(duì)身份證、人臉、人像以及住宿、消費(fèi)等信息的采集分析,勾畫出目標(biāo)人、時(shí)間、空間等多方信息的關(guān)聯(lián),一張信息網(wǎng)鋪下來,要鎖定目標(biāo)人物,技術(shù)模型其實(shí)很簡(jiǎn)單。一個(gè)城市的視頻監(jiān)控采集上千萬人臉信息,交通卡口采集千萬級(jí)的車輛數(shù)據(jù)這些都很正常,要織就城市級(jí)大數(shù)據(jù)網(wǎng)絡(luò)需要構(gòu)建真正具有超強(qiáng)計(jì)算能力的大數(shù)據(jù)架構(gòu)。
前面我們講到給人、車、物都打上屬性標(biāo)簽,當(dāng)所有的目標(biāo)都標(biāo)簽化后,在整個(gè)大數(shù)據(jù)平臺(tái)架構(gòu)當(dāng)中,當(dāng)我們輸入一串車牌、一張人臉信息時(shí),系統(tǒng)不光可以彈出搜索結(jié)果,還能呈現(xiàn)關(guān)聯(lián)信息,比如通過車牌關(guān)聯(lián)的車主信息,這種關(guān)聯(lián)信息一般具有長(zhǎng)期性,時(shí)間跨度以年為單位,系統(tǒng)要保障在挖掘歷史關(guān)聯(lián)信息的時(shí)候也能夠?qū)崿F(xiàn)毫秒級(jí)反饋結(jié)果。
這其中最難的是把持續(xù)更新的數(shù)據(jù)信息融合進(jìn)來并和歷史信息串聯(lián)在一起,需要不斷增加信息節(jié)點(diǎn),擴(kuò)展關(guān)聯(lián)模型。針對(duì)這個(gè)技術(shù)門檻,以薩采用的是定制化融合引擎,它可以把共性的信息先計(jì)算出來,當(dāng)新的不同類型的數(shù)據(jù)采集完后,后臺(tái)程序只需要在業(yè)務(wù)模型新建一個(gè)模塊,添加一個(gè)接口,然后以插積木的方式將模塊插入到引擎當(dāng)中即可。
Q:在這種針對(duì)城市級(jí)大數(shù)據(jù)智能分析處理系統(tǒng)上,作為技術(shù)提供商,大家的競(jìng)爭(zhēng)點(diǎn)在哪里?
A:競(jìng)爭(zhēng)點(diǎn)主要在于兩點(diǎn),一是跟用戶需求的貼合程度,第二是技術(shù)門檻。從最開始的設(shè)計(jì)思路到不斷的實(shí)踐再到真正落地應(yīng)用,這期間以薩已經(jīng)積累了相對(duì)豐富的經(jīng)驗(yàn),在2014年便已經(jīng)理順了公安大數(shù)據(jù)的應(yīng)用邏輯和趨勢(shì),這幾年一直以高規(guī)格的標(biāo)準(zhǔn)細(xì)化每一項(xiàng)技術(shù)的應(yīng)用水平。業(yè)內(nèi)其他廠商百萬級(jí)數(shù)據(jù)要求一分鐘檢索出來,但我們要求的是做到毫秒級(jí),為后期的數(shù)據(jù)大融合鋪墊基礎(chǔ),這也構(gòu)成了以薩目前的技術(shù)壁壘。
Q:大數(shù)據(jù)融合目前存在哪些難點(diǎn)? 對(duì)此,您想向業(yè)界呼吁什么?
A:我們?cè)O(shè)想很大,而且技術(shù)也比較成熟?,F(xiàn)在的問題第一是人力不足,第二行業(yè)環(huán)境還比較浮躁。我們希望整個(gè)業(yè)界能踏踏實(shí)實(shí)沉下來落到實(shí)處,少一些炒作和噱頭,真正從業(yè)務(wù)需求來引導(dǎo)技術(shù)的發(fā)展,而不是反過來由技術(shù)去整合推動(dòng)業(yè)務(wù)。正常的流程應(yīng)該是:深入了解業(yè)務(wù)需求-提出可行性構(gòu)想-攻關(guān)技術(shù)難題-落實(shí)方案。第三是管理思維和管理模式的改變。要實(shí)現(xiàn)大數(shù)據(jù)的融合貫通,需要打通各部門之間存在的數(shù)據(jù)孤島,這其中最難解決的其實(shí)是改變管理者慣有的思維模式,目前以公安系統(tǒng)為代表的應(yīng)用領(lǐng)域已經(jīng)在推動(dòng)這種思潮的變革,相信接下來,國(guó)家在推動(dòng)大數(shù)據(jù)融合方面的腳步將進(jìn)一步加快。
Q:您如何研判在全球范圍內(nèi),中國(guó)在這方面的技術(shù)領(lǐng)先性?
A:目前在全球安防領(lǐng)域,中國(guó)智能安防技術(shù)和安防系統(tǒng)的整體布局都是最領(lǐng)先且全面的,這跟政府的大力投入有很大關(guān)系,當(dāng)然也涉及到國(guó)家在安全和隱私方面的側(cè)重點(diǎn)。不過從技術(shù)層面來講,在人臉識(shí)別、計(jì)算機(jī)視覺等國(guó)際性比賽中,中國(guó)企業(yè)一直都名列前茅,盡管是實(shí)驗(yàn)室數(shù)據(jù),但也足以證明技術(shù)的領(lǐng)先性是值得肯定的。
編后語:
數(shù)據(jù)不是一灘靜止不動(dòng)的死水,然后做水的分類和水質(zhì)的分析,而是一條流動(dòng)的數(shù)據(jù)河流,大數(shù)據(jù)的真正含義是在流動(dòng)的實(shí)時(shí)數(shù)據(jù)中根據(jù)數(shù)據(jù)分析需求,不斷把有價(jià)值的數(shù)據(jù)打撈出來,形成源源不斷的價(jià)值數(shù)據(jù)流和數(shù)據(jù)庫,同時(shí)可以根據(jù)應(yīng)用邏輯和交集需求,形成以視頻AI為核心的多維數(shù)據(jù)融合應(yīng)用,產(chǎn)生大數(shù)據(jù)真正的應(yīng)用價(jià)值,為城市級(jí)安全防范、預(yù)警以及城市規(guī)劃和管理提供有力支撐。這是以薩提供給我們的關(guān)于大數(shù)據(jù)的內(nèi)涵和意義的解讀。
多維數(shù)據(jù)融合的價(jià)值無容置疑,但是前提是要打破條狀管理鏈條造成的數(shù)據(jù)孤立,某些城市已經(jīng)就數(shù)據(jù)共享立法,從法制層面從頂層開始打通大數(shù)據(jù)應(yīng)用的任督二脈。期待更多的城市跟進(jìn),管理必須觀念先行,才能有效應(yīng)用技術(shù)手段落地解決越來越龐雜的城市管理問題。