隨著對復雜 AI 功能的需求不斷增加,VAST Data 推出了 VAST 數(shù)據(jù)平臺(Data Platform),該平臺現(xiàn)已通過 NVIDIA BlueField DPU 進行增強。這項創(chuàng)新專為滿足 AI 驅(qū)動數(shù)據(jù)中心的嚴格要求而量身打造,并優(yōu)化了 AI 工作負載和數(shù)據(jù)管理。
本文介紹了 NVIDIA BlueField DPU 如何為 VAST 帶來顯著的性能和效率提升,確保更快的數(shù)據(jù)訪問和處理速度,同時降低功耗和空間需求。
管理 AI 工作負載面臨的挑戰(zhàn)
優(yōu)化 AI 工作負載需要管理大量非結構化數(shù)據(jù),并確保高速數(shù)據(jù)訪問以及保持強大的數(shù)據(jù)安全性。傳統(tǒng)的數(shù)據(jù)存儲和處理系統(tǒng)經(jīng)常面臨延遲、效率低下和可擴展性問題,這些問題可能會影響 AI 應用程序的性能。此外,實時數(shù)據(jù)處理和嚴格安全性的需求也增加了有效管理 AI 工作負載的復雜性。
NVIDIA BlueField DPU 的優(yōu)勢
NVIDIA BlueField-3 DPU 使組織能夠滿足現(xiàn)代 AI 工作負載的苛刻要求,確保更快的數(shù)據(jù)訪問速度、強大的安全性和更高的整體效率。繼續(xù)閱讀如下內(nèi)容,詳細了解 NVIDIA BlueField DPU 為 VAST 數(shù)據(jù)平臺和 AI 工作負載帶來的具體優(yōu)勢。
提高存儲效率、數(shù)據(jù)完整性和安全性
將 NVIDIA BlueField DPU 集成到 Vast 數(shù)據(jù)平臺代表著存儲處理技術的重大飛躍。通過將基本存儲操作卸載到 DPU,可以降低功耗和空間,同時提高存儲網(wǎng)絡帶寬、提高性能并確??蓴U展性。這些增強功能對于處理 AI 應用程序中常見的大量數(shù)據(jù)至關重要,有助于提高數(shù)據(jù)訪問速度和處理速度。
VAST Data 的最新產(chǎn)品代表了 AI 環(huán)境數(shù)據(jù)平臺的關鍵發(fā)展,將高密度存儲與前沿的 NVIDIA BlueField DPU 技術相結合。這種強大的組合可確保出色的性能、最大限度地提高效率,并為最具挑戰(zhàn)性的 AI 環(huán)境提供所需的可擴展性。
在 VAST Data 的傳統(tǒng)架構中,CNode(計算節(jié)點)是負責運行存儲協(xié)議和管理服務的 x86 服務器。VAST 的獨特方法是將 NVIDIA BlueField DPU 集成到其平臺中。這種集成將基本存儲操作從 CPU 卸載到 DPU,從而提高存儲網(wǎng)絡帶寬并降低功耗。卸載到 DPU 可以減少所需的專用 CNode 數(shù)量,因為 DPU 可以更高效地處理必要的計算任務。
同樣,通過減少計算節(jié)點,還可以減少對外部網(wǎng)絡交換機的依賴,從而降低所需交換機的端口數(shù)量以及管理這些端口的復雜性和成本,從而簡化網(wǎng)絡架構。NVIDIA BlueField DPU 通過卸載和隔離存儲功能、輔助并行數(shù)據(jù)服務以及在 AI 環(huán)境中提供塊存儲服務,顯著增強了 I/O 操作的處理能力,從而實現(xiàn)更精簡、更高效的基礎設施,并減少了實現(xiàn)相同性能水平所需的物理服務器數(shù)量。
NVIDIA BlueField DPU 通過多種方式增強 VAST 數(shù)據(jù)平臺,包括:
提高 I/O 性能:BlueField 可助力 NVMe 存儲訪問,以超過 60 GB/s 的速度處理數(shù)據(jù),從而優(yōu)化數(shù)據(jù)密集型應用程序的訪問速度。
更好的存儲性能:BlueField DPU 支持高達 400 Gbps,可以提高吞吐量和 I/O 效率。GPUDirect Storage 和 RDMA over Converged Ethernet (ROCE)等功能可以實現(xiàn)高效、低延遲的數(shù)據(jù)傳輸,對于高速數(shù)據(jù)密集型應用程序至關重要。
服務質(zhì)量:每臺 GPU 服務器均配備專用的 BlueField-3 DPU,為 VAST 并行服務操作系統(tǒng)提供支持。這使每個 DPU 都能夠讀取和寫入 VAST 數(shù)據(jù)平臺的共享命名空間,而無需跨容器協(xié)調(diào) I/O,從而消除爭用。
安全加速:BlueField DPU 可卸載加密和深度數(shù)據(jù)包檢測等關鍵安全任務,減少 CPU 上的計算負載,并提高整體系統(tǒng)性能。BlueField-3 還無需使用內(nèi)核驅(qū)動來處理 IO,這種方法可減少攻擊面,并最大限度地減少主機漏洞的潛在影響,尤其是在多租戶環(huán)境中。
提高效率:BlueField DPU 顯著增強了存儲處理能力,降低了功耗和空間需求,同時提高了存儲網(wǎng)絡帶寬。
成果
將 NVIDIA BlueField DPU 集成到 VAST 數(shù)據(jù)平臺后,取得了令人矚目的成果:
性能增強:BlueField-3 從主 CPU 卸載計算密集型任務以提高性能,這對于 AI 應用程序是至關重要的。
服務質(zhì)量:通過在容器內(nèi)操作共享命名空間,每個 GPU 服務器都有一個專用的 BlueField DPU,可實現(xiàn)與數(shù)據(jù)節(jié)點的直接通信,從而減少延遲和跳數(shù),從而簡化 I/O 操作。
提高效率:該平臺通過降低 77% 的功耗和 73% 的機架空間需求,為數(shù)據(jù)中心提供更具可持續(xù)性的解決方案。
強大的安全性:增強的安全功能可確保數(shù)據(jù)完整性并防止未經(jīng)授權的訪問。
這些進步使得 VAST 數(shù)據(jù)平臺成為提高 AI 驅(qū)動數(shù)據(jù)中心的性能和效率的關鍵組件。該平臺能夠以更低延遲和更高安全性處理大量數(shù)據(jù)的能力尤為顯著,為 AI 創(chuàng)新提供了堅實的基礎。
通過集成 BlueField,VAST 可加速運營、簡化安全管理并增強監(jiān)控功能。BlueField 提供改進的數(shù)據(jù)服務和強大的安全功能,包括用于實時洞察和快速異常檢測的高級遙測功能。這種集成不僅優(yōu)化了性能,而且還減少了對大量硬件的需求,從而提高了系統(tǒng)效率和經(jīng)濟效益。BlueField DPU 是推動 VAST 數(shù)據(jù)平臺(專為現(xiàn)代 AI 數(shù)據(jù)中心定制)先進性能和效率的關鍵組件。
VAST Data 與 NVIDIA 之間的合作對于推進 AI 基礎設施發(fā)展至關重要,并徹底改變了 AI 驅(qū)動數(shù)據(jù)基礎設施的格局。通過利用 NVIDIA BlueField-3 DPU,VAST Data 成功增強了其 AI 云架構,提供了前所未有的性能、安全性和效率。這種集成使 VAST Data 能夠?qū)㈥P鍵的網(wǎng)絡、存儲和安全任務從 CPU 卸載到 DPU,顯著減少數(shù)據(jù)中心的占用空間和功耗。
總結
NVIDIA 和 VAST Data 合作,為現(xiàn)代企業(yè)和服務提供商量身打造強大、可擴展且安全的 AI 基礎設施。此集成解決方案可提高 AI 工作負載的性能,并簡化廣泛 AI 系統(tǒng)的部署和管理。
此外,NVIDIA BlueField-3 DPU 使 VAST Data 能夠采用零信任安全模型,從而確保數(shù)據(jù)隔離和針對威脅的強大防護。在多租戶環(huán)境中,安全高效的數(shù)據(jù)管理至關重要,這是一項基本功能。DPU 還支持直接在 AI 服務器中集成存儲和安全處理服務,并實現(xiàn)服務質(zhì)量(QoS)功能,以協(xié)調(diào) DNode(數(shù)據(jù)節(jié)點)之間的 I/O,從而實現(xiàn)真正的線性可擴展性并消除數(shù)據(jù)服務爭用。
隨著 AI 不斷推動創(chuàng)新和重塑行業(yè),VAST Data 和 NVIDIA 之間的合作體現(xiàn)了將先進的 DPU 技術融入數(shù)據(jù)中心架構的優(yōu)勢。