據(jù)外媒報(bào)道,麻省理工學(xué)院(MIT)的科學(xué)家們找到了一種可以在運(yùn)動(dòng)模糊的視頻幀中恢復(fù)細(xì)節(jié)并重現(xiàn)清晰圖像的方法。這套“視覺(jué)投影模型”通過(guò)使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)來(lái)解碼圖像。
MIT計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的研究人員通過(guò)掃描數(shù)千對(duì)圖像(投影)訓(xùn)練CNN,其中一幅圖像質(zhì)量較低,另一幅圖像則圖像模糊。神經(jīng)網(wǎng)絡(luò)利用這些信息然后通過(guò)學(xué)習(xí)像素模式和像素來(lái)源從本質(zhì)上逆轉(zhuǎn)模糊效果。
CNN的另一部分責(zé)備稱為“變分自動(dòng)編碼器(variational autocoder)”,它能夠分析輸出并評(píng)估網(wǎng)絡(luò)跟信號(hào)的匹配程度。隨后,它則會(huì)創(chuàng)建一幅“藍(lán)圖”告訴AI如何對(duì)一個(gè)投影到所有可能的匹配源進(jìn)行處理。當(dāng)給定一幅新圖像時(shí),CNN會(huì)檢查像素模式并使用該藍(lán)圖尋找可能導(dǎo)致模糊的每個(gè)信號(hào),然后它組合數(shù)據(jù)創(chuàng)建一個(gè)“高維”副本。
這篇論文的首席作者、CSAIL的博士后Guha Balakrishnan表示:“對(duì)于我們能夠恢復(fù)這些細(xì)節(jié)就像變魔法一樣?!?/p>
實(shí)際上,研究人員對(duì)它在醫(yī)學(xué)領(lǐng)域的作用更感興趣。他們相信這項(xiàng)技術(shù)可以被用來(lái)制造類似于X射線CT的3D掃描。這一突破將能顯著降低成本,因?yàn)镸RI和CT設(shè)備都非常昂貴。該軟件將能夠從成本相對(duì)較低的X射線等低信息圖像中重建出高信息圖像。
“如果我們能將X射線轉(zhuǎn)換成CT掃描,那將在某種程度上改變游戲規(guī)則,”Balakrishnan說(shuō)道,“你只需拍一張X光片,然后通過(guò)我們的算法就能看到所有丟失的信息?!?/p>