在針對的目標市場方向,阿里云表示圖像識別分為生物識別、物體與場景識別、視頻識別等,預計2020年的總市場規(guī)模將達到數(shù)百億美元,應用領域包括金融、安防、醫(yī)療、自動駕駛、手機、工業(yè)、娛樂圖片、媒資等。
阿里云認為,對于手機廠商和圖片娛樂業(yè)來說,行業(yè)現(xiàn)狀為沒有相關的技術儲備或儲備不足,核心需求包括人臉AR、智能相冊管理、圖片安全監(jiān)控等,阿里云的價值在于高性能底層核心算法;對于金融行業(yè)和安全監(jiān)控行業(yè)來說,行業(yè)現(xiàn)狀為人工圖像辨別的成本高、支付安全性低,核心需求包括身份識別、人臉支付、敏感圖片識別、客戶行為分析等,阿里云的價值在于降低人工成本、實現(xiàn)智能識別、提高識別準確率、增強安全性等;對于電子商務行業(yè)來說,行業(yè)現(xiàn)狀為購物場景和體驗單一、人工圖片監(jiān)控力度弱,核心需求為試妝試戴、電商圖像分析、電商圖像檢索等,阿里云的價值為豐富購物體驗與購物場景、增強圖片安全性等。
與電商、搜索和存儲等緊密結合,阿里云一站式視覺產(chǎn)品服務生態(tài)平臺的商業(yè)模式為標準化產(chǎn)品收費、定制化方案項目收費、SDK收費以及共建分成等方式。阿里云方面表示,其圖像識別服務面向全球市場,目標客戶包括了行業(yè)客戶和行業(yè)ISV等。
車輛檢測刷新KITTI的新紀錄
在一個月前的5月18日,阿里云的智能視覺識別算法刷新了全球權威機器視覺算法測評平臺KITTI的新紀錄,將該測評的車輛檢測準確率拉升至90.46%。在車輛檢測這一競賽項目上,要求參賽計算機視覺算法能檢測出由車載相機所拍攝的車輛以及估算車頭朝向。該測試包含7千多張訓練圖像和7千多張測試圖像,單張圖像上有車輛遮擋等真實場景,檢測挑戰(zhàn)相當大。本次技術突破是由阿里巴巴iDST視覺計算研究員華先勝領導的團隊完成,他們提出了基于區(qū)域融合決策和上下文相關的多任務深度神經(jīng)網(wǎng)絡,用于復雜場景下的車輛檢測任務,重點解決其中多視角、多姿態(tài)以及車輛遮擋等問題。在訓練過程中,還借鑒了GAN(生成對抗網(wǎng)絡)中的對抗訓練模式。
華先勝在云棲大會·上海峰會上表示,當天發(fā)布的“圖像識別”和“人臉識別”兩項服務僅是阿里云的智能視覺服務中的一部分技術,阿里云已將智能視覺技術集成到阿里云ET當中,阿里云ET的人臉識別技術已經(jīng)實現(xiàn)了人臉檢測、器官輪廓定位、1對1人臉認證和1對多人臉識別等多個功能。阿里云的視覺識別服務還包括視頻分析、視覺設計、工業(yè)診斷、醫(yī)療診斷等,將陸續(xù)推向市場。
此外,阿里云的智能視覺識別服務還已經(jīng)在城市大腦中落地。城市大腦是包括阿里云在內的13家企業(yè)聯(lián)合杭州市政府發(fā)起的項目,旨在構建一個城市級的人工智能中樞,其中分析視頻是城市大腦獲取信息的關鍵。以交通治理為例,城市大腦通過普通攝像頭就可以感知復雜路況下車輛的運行狀態(tài)和軌跡,對這些數(shù)據(jù)進行實時分析,并基于此進行多種智能交通優(yōu)化。