欧美,日韩中文字幕在线,男女性杂交内射妇女bbwxz,久久99久久9国产精品免费看,久久久久无码精品国产app,免费无码成人片

a&s專業(yè)的自動化&安全生態(tài)服務平臺
公眾號
安全自動化

安全自動化

安防知識網(wǎng)

安防知識網(wǎng)

手機站
手機站

手機站

大安防供需平臺
大安防供需平臺

大安防供需平臺

資訊頻道橫幅A1
首頁 > 資訊 > 正文

南京大學教授申富饒:圖像識別的發(fā)展與挑戰(zhàn)

在本次大會中,南京大學人工智能學院教授、博士生導師申富饒給我們帶來《機器學習應用于圖像識別:發(fā)展與挑戰(zhàn)》主題分享,詳細介紹和分析了圖像識別的實現(xiàn)原理、主要算法類型,以及面臨的挑戰(zhàn)等研究成果,讓我們更清晰地了解人工智能的發(fā)展現(xiàn)狀。

  12月13日,由中共肥東縣委、肥東縣人民政府、億達中國控股有限公司主辦,肥東縣投資促進中心、合肥東部新城核心區(qū)綜合管理辦公室、合肥東部新城建設投資有限公司、億達合肥智慧科技城發(fā)展有限公司承辦,中國高科技行業(yè)門戶OFweek維科網(wǎng)協(xié)辦的“2019中國(合肥 · 肥東)AIoT產(chǎn)業(yè)發(fā)展論壇”在肥東安徽水利和順大酒店隆重開幕。

  在本次大會中,南京大學人工智能學院教授、博士生導師申富饒給我們帶來《機器學習應用于圖像識別:發(fā)展與挑戰(zhàn)》主題分享,詳細介紹和分析了圖像識別的實現(xiàn)原理、主要算法類型,以及面臨的挑戰(zhàn)等研究成果,讓我們更清晰地了解人工智能的發(fā)展現(xiàn)狀。

  機器學習的原理

  在生活當中,人類可以根據(jù)自身的經(jīng)驗進行總結,歸納出一些規(guī)律,當遇到新問題時,人類會利用這些規(guī)律來進行預測,從而做出適當?shù)姆磻?/p>

  而機器學習中的歷史數(shù)據(jù)就相當于人類的經(jīng)驗,將這些歷史數(shù)據(jù)通過訓練得到機器學習模型,當機器要解決實際問題時可以根據(jù)學習模型進行預測,從而得到關于未知數(shù)據(jù)的一些屬性以做出恰當?shù)姆磻?。在現(xiàn)實生活中,機器學習有很多重要的應用,而圖像識別是其中一個極其重要而又相當具有挑戰(zhàn)性的課題。

  圖像識別的模式分類

  圖像識別是一個模式分類問題,它的目標是識別圖像中的物體,劃分到不同的類別,實現(xiàn)最小的分類誤差?,F(xiàn)實生活中的圖像大致可分為語義級圖像、細粒度圖像、實例級圖像3種,申教授認為,各個類別屬于不同的物種,往往具有較大的類間方差,而類內則具有較小的類內誤差。例如識別普適物體的小型數(shù)據(jù)集CIFAR-10,包含了6種動物與4種交通工具。

  對于圖像識別而言,人類可以輕易地判斷出圖像中的顏色、形狀、部件等特征,作為識別目標的依據(jù),然而圖像在計算機中被保存為數(shù)字格式。申教授分析道:機器學習方法可行的前提條件是訓練數(shù)據(jù)中包含對預測任務有意義的特征,這些特征隱藏在看似毫無意義的數(shù)字之中,因此必須先進行特征的提取。

  深度卷積網(wǎng)絡的發(fā)展

  在圖像識別的研究歷程當中,最主流的算法當屬卷積神經(jīng)網(wǎng)絡。卷積神經(jīng)網(wǎng)絡(CNN)以卷積核為基本結構單元,通過局部連接、權值共享,模擬生物視覺系統(tǒng)的感受野機制,自動學習圖像的特征表示。

  LeNet5是早期的卷積神經(jīng)網(wǎng)絡模型,共有 7 層,具備了卷積層、池化層等深度卷積網(wǎng)絡中的核心結構;AlexNet對卷積神經(jīng)網(wǎng)絡的結構和訓練算法進行了大量創(chuàng)新,奠定了深度學習在計算機視覺領域的優(yōu)勢地位;ResNet通過引入殘差連接,基本消除了增加深度帶來的退化現(xiàn)象,能夠通過單純地增加網(wǎng)絡深度,來提高網(wǎng)絡性能;DenseNet將殘差連接的思想發(fā)展到極致,實現(xiàn)了資源的最大化利用和計算量的壓縮;Google提出的MobileNets是一個輕量級的深層神經(jīng)網(wǎng)絡,面向移動應用設計,大幅提升了計算速度。

  圖像識別的三大挑戰(zhàn)

  在人眼看來,一張圖片就是一幅彩色的圖畫,但是在機器看來,它就是一大串數(shù)字,在機器學習的各種應用中,圖像識別是一個特別困難的任務,申教授認為主要面臨以下三個挑戰(zhàn)。

  第一個挑戰(zhàn)是嵌入式深度學習。深度卷積網(wǎng)絡在圖像識別算法中占據(jù)了統(tǒng)治地位,模型精度也在不斷提升,然而相應地也帶來了計算復雜度的提升。目前有很多嵌入式應用需要使用圖像識別技術,但嵌入式平臺往往受到芯片性能、內存容量等硬件資源的限制,無法運行當前主流的深度神經(jīng)網(wǎng)絡,或者無法滿足速度要求。

  第二個挑戰(zhàn)是可解釋性。申教授分析道:圖像識別程序像是一個黑盒子,只給出結果,而不能說明結果是如何產(chǎn)生的。我們能做的就是把數(shù)據(jù)丟給識別算法,期望它能夠給出正確的答案。但是當答案發(fā)生錯誤時,我們無法得知錯誤產(chǎn)生的原因,只能寄望于調節(jié)參數(shù)之類的手段能讓程序得到改善。目前,算法的可解釋性問題正在逐漸得到重視。

  第三個挑戰(zhàn)是對抗樣本問題。深度學習中可解釋性的缺失帶來了另一個問題,在某些應用環(huán)境中,圖像識別程序可能會受到惡意攻擊,攻擊者試圖“欺騙”圖像識別程序,使程序的預測出錯。這就要求我們設計可靠的神經(jīng)網(wǎng)絡,能夠具有防止惡意攻擊的能力。

  未來——不斷發(fā)展與完善

  總的來說,即便仍然面臨著非常多的挑戰(zhàn),圖像識別還是取得了很大的成功?,F(xiàn)在的神經(jīng)網(wǎng)絡都是由人來設計,在未來,或許會讓程序自己進行設計,讓機器進行增量學習、終身學習,到那時,機器在應用的過程當中會不斷感知環(huán)境的變化,然后不斷調整自己的行為以適應環(huán)境需要。

  總之,圖像識別是人工智能的一個重要領域,隨著技術的不斷發(fā)展,圖像識別也會不斷進行完善以適應更多的需求。

參與評論
回復:
0/300
文明上網(wǎng)理性發(fā)言,評論區(qū)僅供其表達個人看法,并不表明a&s觀點。
0
關于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺,自1994年品牌成立以來,一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術及市場趨勢的專業(yè)媒體傳播和品牌服務。從安全管理到產(chǎn)業(yè)數(shù)字化,a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗,提供媒體、活動、展會等整合營銷服務。

免責聲明:本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權所有方的,皆為無意。如您是字體廠商、圖片文字廠商等版權方,且不允許本站使用您的字體和圖片文字等素材,請聯(lián)系我們,本站核實后將立即刪除!任何版權方從未通知聯(lián)系本站管理者停止使用,并索要賠償或上訴法院的,均視為新型網(wǎng)絡碰瓷及敲詐勒索,將不予任何的法律和經(jīng)濟賠償!敬請諒解!
? 2024 - 2030 Messe Frankfurt (Shenzhen) Co., Ltd, All rights reserved.
法蘭克福展覽(深圳)有限公司版權所有 粵ICP備12072668號 粵公網(wǎng)安備 44030402000264號
用戶
反饋