a&s專業(yè)的自動化&安全生態(tài)服務(wù)平臺

公眾號

安全自動化

安防知識網(wǎng)

手機站

大安防供需平臺

搜索
登錄
|
注冊

搜索

全站搜索
AI應(yīng)用搜索

首頁 > 資訊 > 正文

適用于計算密集型系統(tǒng)的出色 FPGA 和 SoC平臺

作者：Cathal Murphy 2017-07-24 15:09 閱讀 4049 來源：智能電子集成評論區(qū)

GPU 架構(gòu)的局限性

　　本部分將深入研究典型的 GPU 架構(gòu)，以揭示它的局限性以及如何將它們應(yīng)用于各種算法和工作負載。

　　SIMT ALU 陣列

　　圖 1 給出了典型的 GPU 方框圖。通用 GPU 計算功能的核心是大型的算數(shù)邏輯單元 (ALU) 或內(nèi)核陣列。這些 ALU 通常被認為是單指令多線程 (SIMT)，類似于單指令多數(shù)據(jù) (SIMD)。

　　圖 1：GPU 方框圖

　　基本原理是將工作負載分成數(shù)千個并行的線程。需要大量 GPU 線程來防止 ALU 閑置。然后，對這些線程進行調(diào)度，以使 ALU 組并行執(zhí)行同一(單個)指令。利用 SIMT，GPU 廠商能實現(xiàn)相對 CPU 占位面積更小和能效更高的方案，因為內(nèi)核的很多資源都可與相同組中的其他內(nèi)核共享。

　　然而，顯然只是特定的工作負載(或部分工作負載)能被高效映射到這種大規(guī)模并行架構(gòu)中。如果構(gòu)成工作負載的線程不具有足夠的共性或并行性(例如連續(xù)工作負載或適度并行工作負載)，則 ALU 會閑置，導致計算效率降低。此外，構(gòu)成工作負載的線程預期要最大化 ALU 利用率，從而產(chǎn)生額外的時延。即使有英偉達的 Volta 架構(gòu)中的獨立線程調(diào)度這樣的功能，底層

　　架構(gòu)也保持 SIMT，也需要大規(guī)模并行工作負載。

　　對于連續(xù)、適度并行或稀疏工作負載，GPU 提供的計算功能和效率甚至低于 CPU。例如用 GPU 實現(xiàn)稀疏矩陣計算;如果非零元素數(shù)量較少，則從性能和效率角度看 GPU 低于或等同于 CPU。有趣的是，很多研究人員正在研究稀疏卷積神經(jīng)網(wǎng)絡(luò)，以利用很多卷積神經(jīng)網(wǎng)絡(luò)中的大規(guī)模冗余。這種趨勢顯然

　　在機器學習推斷領(lǐng)域向 GPU 提出了挑戰(zhàn)。稀疏矩陣計算也是大數(shù)據(jù)分析中的關(guān)鍵環(huán)節(jié)。

　　包含大量并行計算任務(wù)的大多數(shù)工作負載也包含一些連續(xù)或適度并行元素，意味著需要 GPU-CPU 混合系統(tǒng)來滿足系統(tǒng)性能要求。顯然，高端 CPU 需求會影響平臺的效率和成本效益，CPU 與 GPU 之間的通信也會給系統(tǒng)增加潛在瓶頸。

　　SIMT/GPU 架構(gòu)的另一個局限性是 ALU 的功能取決于它的固定指令集和所支持的數(shù)據(jù)類型。

1 2 3 4 5 6 7 8 9 下一頁

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

您可能也喜歡這些文章

參與評論

回復：

0/300

文明上網(wǎng)理性發(fā)言，評論區(qū)僅供其表達個人看法，并不表明a&s觀點。

0

推薦專題

熱門排行

關(guān)于我們

a&s傳媒是全球知名展覽公司法蘭克福展覽集團旗下的專業(yè)媒體平臺，自1994年品牌成立以來，一直專注于安全&自動化產(chǎn)業(yè)前沿產(chǎn)品、技術(shù)及市場趨勢的專業(yè)媒體傳播和品牌服務(wù)。從安全管理到產(chǎn)業(yè)數(shù)字化，a&s傳媒擁有首屈一指的國際行業(yè)展覽會資源以及豐富的媒體經(jīng)驗，提供媒體、活動、展會等整合營銷服務(wù)。

全球網(wǎng)站
法蘭克福
asmag.com
asmag.com.cn
中國臺灣智慧安防網(wǎng)

免責聲明：本站所使用的字體和圖片文字等素材部分來源于互聯(lián)網(wǎng)共享平臺。如使用任何字體和圖片文字有冒犯其版權(quán)所有方的，皆為無意。如您是字體廠商、圖片文字廠商等版權(quán)方，且不允許本站使用您的字體和圖片文字等素材，請聯(lián)系我們，本站核實后將立即刪除！任何版權(quán)方從未通知聯(lián)系本站管理者停止使用，并索要賠償或上訴法院的，均視為新型網(wǎng)絡(luò)碰瓷及敲詐勒索，將不予任何的法律和經(jīng)濟賠償！敬請諒解！

粵公網(wǎng)安備 44030402000264號

用戶
反饋

欧美,日韩中文字幕在线,男女性杂交内射妇女bbwxz,久久99久久9国产精品免费看,久久久久无码精品国产app,免费无码成人片

適用于計算密集型系統(tǒng)的出色 FPGA 和 SoC平臺

GPU 架構(gòu)的局限性