1897年,作家馬克·吐溫在讀到自己訃告時調(diào)侃道:“關(guān)于我的死亡報道,被嚴重夸大了?!蓖瑯?,在數(shù)據(jù)存儲行業(yè),機械硬盤多年來也經(jīng)歷著諸如江河日下等被夸大的報道。
然而,就像這位“被死亡”但此后健在多年且頗為高產(chǎn)的作家馬克·吐溫一樣,機械硬盤也同樣得到長足發(fā)展,存儲了超大規(guī)模云數(shù)據(jù)中心近90%的數(shù)據(jù),而世界上絕大多數(shù)EB級數(shù)據(jù)都存儲于這些數(shù)據(jù)中心。隨著云和人工智能生成的數(shù)據(jù)量急劇增加,對大容量存儲的需求之大前所未有。
當然,存儲需求的提升并非什么新鮮事。新鮮的是需要存儲的數(shù)據(jù)飛速增長。市場研究機構(gòu)IDC預測,2027年,全球產(chǎn)生的數(shù)據(jù)量將達到291ZB,而在2023年,該數(shù)據(jù)為129ZB,相當于2022-2027年復合年增長率為22.4%(來源,IDC全球數(shù)據(jù)圈預測,2023-2027年,#US50554523,2023年4月)。
據(jù)Statista稱,從2010年到2022年,全球創(chuàng)建、存儲、復制和消費的數(shù)據(jù)量增加了60倍,并且這一速度還將繼續(xù)加快。
推動這一趨勢的是生成式人工智能和大語言模型的部署。由于需要大量數(shù)據(jù)來訓練和優(yōu)化,最好的人工智能模型在很大程度上依賴于大容量數(shù)據(jù)存儲。領先的公司將越來越希望保留其原始數(shù)據(jù)集和人工智能處理的結(jié)果。
以特斯拉為例,特斯拉從世界各地道路上的數(shù)百萬輛電動汽車收集大量數(shù)據(jù),用于訓練人工智能駕駛模型和地圖繪制。
社交媒體是另一個例子:Facebook、LinkedIn、小紅書和YouTube等平臺收集大量數(shù)據(jù),用人工智能進行分析。2023年,6798億美元的全球廣告收益證明了該商業(yè)模式的成功。
世界經(jīng)濟論壇在一項調(diào)查中表示,75%的受訪公司預計在未來五年內(nèi)采用人工智能技術(shù)來增強其產(chǎn)品和服務并提高生產(chǎn)力(來源:世界經(jīng)濟論壇,2023年5月)。
總之,我們預計ChatGPT、文心一言(Ernie Bot)和Bard等生成式人工智能技術(shù)將在未來五年內(nèi)創(chuàng)建100ZB的數(shù)據(jù)。
存儲所有數(shù)據(jù)
為了應對數(shù)據(jù)增長,需要更多的存儲容量,這就進一步需要更多的物理數(shù)據(jù)中心來容納面密度和容量更高的存儲設施。
大多數(shù)通信服務提供商和數(shù)據(jù)中心運營商都會混合采用機械硬盤和固態(tài)硬盤。他們設計的存儲架構(gòu)由精心優(yōu)化的存儲介質(zhì)組合而成,考慮了支持的工作負載的成本、容量和性能要求。
隨著數(shù)據(jù)量的飆升,對機械硬盤和固態(tài)硬盤的需求將繼續(xù)居高,機械硬盤服務大容量工作負載,同時,固態(tài)硬盤解決具有更高性能要求的工作負載。
數(shù)據(jù)的指數(shù)級增長將成為促進大容量機械硬盤需求的關(guān)鍵驅(qū)動力,機械硬盤與閃存的協(xié)同作用將繼續(xù)支持現(xiàn)代工作負載。
硬盤繼續(xù)扮演關(guān)鍵角色
為了應對所預測的數(shù)據(jù)存儲增長,硬盤必須在存儲容量方面做得更好,這意味著硬盤的面密度需要大幅增加。幸運的是,硬盤行業(yè)一直在努力解決這個問題,引入了新的技術(shù),如熱輔助磁記錄(HAMR),可以成倍地擴展碟片密度。希捷第一代HAMR硬盤每個碟片容量為3TB,相比之下,傳統(tǒng)PMR硬盤單碟片最高容量為2.4TB。預計未來幾代HAMR硬盤將進一步將面密度提高到單碟片容量4TB或5TB。這相當于在不久的將來,我們將擁有40TB-50TB的大容量硬盤。
硬盤外形規(guī)格不變的情況下增加容量,這有利于數(shù)據(jù)中心輕松地在現(xiàn)有硬盤壽命結(jié)束時進行更換,以最低的成本擴展整個數(shù)據(jù)中心的存儲容量,且?guī)缀醪粫斐蓸I(yè)務中斷。在多PB和EB規(guī)模上,將16TB的傳統(tǒng)PMR硬盤替換為30TB的HAMR硬盤可以顯著節(jié)省功耗和其他運營成本。
事實上,由于數(shù)據(jù)中心對耗電量和國家發(fā)電能力的影響,世界上許多國家都暫停了數(shù)據(jù)中心的部署。硬盤面密度的創(chuàng)新是許多數(shù)據(jù)中心運營商在有限資源下管理數(shù)據(jù)激增問題的一個強有力解決方案。
規(guī)模上的可持續(xù)性
從規(guī)模上看,面密度創(chuàng)新使企業(yè)能夠在現(xiàn)有空間中找到更多空間。HAMR技術(shù)可以極大地增加數(shù)據(jù)中心的容量,而無需增加數(shù)據(jù)中心的占地面積和成本。
一般來說,面密度等于更環(huán)保的數(shù)據(jù)中心和更可持續(xù)的存儲。提高能源效率可減少數(shù)據(jù)中心對環(huán)境的影響和運營成本,同時從長遠來看,可以提高性能。同一數(shù)據(jù)中心占地面積內(nèi)的數(shù)據(jù)越多,意味著有功功率(每TB瓦數(shù))的大幅降低;它幫助企業(yè)可持續(xù)運營并實現(xiàn)其碳減排目標。
結(jié)論
在人工智能的浪潮風靡全球時,當前行業(yè)的目光主要聚焦在人工智能的顛覆性潛力、對人工智能處理器和計算引擎不斷增長的需求、以及對云存儲容量的需求。然而,這往往忽略了云存儲實則依賴于硬盤而存在的事實。為了充分發(fā)揮人工智能的潛力,我們需要通過增加面密度來大幅增加硬盤的容量。隨著希捷開始批量生產(chǎn)HAMR硬盤,硬盤行業(yè)已做好準備去應對這一挑戰(zhàn)。