1897年,作家馬克·吐溫在讀到自己訃告時(shí)調(diào)侃道:“關(guān)于我的死亡報(bào)道,被嚴(yán)重夸大了?!蓖瑯樱跀?shù)據(jù)存儲(chǔ)行業(yè),機(jī)械硬盤(pán)多年來(lái)也經(jīng)歷著諸如江河日下等被夸大的報(bào)道。
然而,就像這位“被死亡”但此后健在多年且頗為高產(chǎn)的作家馬克·吐溫一樣,機(jī)械硬盤(pán)也同樣得到長(zhǎng)足發(fā)展,存儲(chǔ)了超大規(guī)模云數(shù)據(jù)中心近90%的數(shù)據(jù),而世界上絕大多數(shù)EB級(jí)數(shù)據(jù)都存儲(chǔ)于這些數(shù)據(jù)中心。隨著云和人工智能生成的數(shù)據(jù)量急劇增加,對(duì)大容量存儲(chǔ)的需求之大前所未有。
當(dāng)然,存儲(chǔ)需求的提升并非什么新鮮事。新鮮的是需要存儲(chǔ)的數(shù)據(jù)飛速增長(zhǎng)。市場(chǎng)研究機(jī)構(gòu)IDC預(yù)測(cè),2027年,全球產(chǎn)生的數(shù)據(jù)量將達(dá)到291ZB,而在2023年,該數(shù)據(jù)為129ZB,相當(dāng)于2022-2027年復(fù)合年增長(zhǎng)率為22.4%(來(lái)源,IDC全球數(shù)據(jù)圈預(yù)測(cè),2023-2027年,#US50554523,2023年4月)。
據(jù)Statista稱,從2010年到2022年,全球創(chuàng)建、存儲(chǔ)、復(fù)制和消費(fèi)的數(shù)據(jù)量增加了60倍,并且這一速度還將繼續(xù)加快。
推動(dòng)這一趨勢(shì)的是生成式人工智能和大語(yǔ)言模型的部署。由于需要大量數(shù)據(jù)來(lái)訓(xùn)練和優(yōu)化,最好的人工智能模型在很大程度上依賴于大容量數(shù)據(jù)存儲(chǔ)。領(lǐng)先的公司將越來(lái)越希望保留其原始數(shù)據(jù)集和人工智能處理的結(jié)果。
以特斯拉為例,特斯拉從世界各地道路上的數(shù)百萬(wàn)輛電動(dòng)汽車收集大量數(shù)據(jù),用于訓(xùn)練人工智能駕駛模型和地圖繪制。
社交媒體是另一個(gè)例子:Facebook、LinkedIn、小紅書(shū)和YouTube等平臺(tái)收集大量數(shù)據(jù),用人工智能進(jìn)行分析。2023年,6798億美元的全球廣告收益證明了該商業(yè)模式的成功。
世界經(jīng)濟(jì)論壇在一項(xiàng)調(diào)查中表示,75%的受訪公司預(yù)計(jì)在未來(lái)五年內(nèi)采用人工智能技術(shù)來(lái)增強(qiáng)其產(chǎn)品和服務(wù)并提高生產(chǎn)力(來(lái)源:世界經(jīng)濟(jì)論壇,2023年5月)。
總之,我們預(yù)計(jì)ChatGPT、文心一言(Ernie Bot)和Bard等生成式人工智能技術(shù)將在未來(lái)五年內(nèi)創(chuàng)建100ZB的數(shù)據(jù)。
存儲(chǔ)所有數(shù)據(jù)
為了應(yīng)對(duì)數(shù)據(jù)增長(zhǎng),需要更多的存儲(chǔ)容量,這就進(jìn)一步需要更多的物理數(shù)據(jù)中心來(lái)容納面密度和容量更高的存儲(chǔ)設(shè)施。
大多數(shù)通信服務(wù)提供商和數(shù)據(jù)中心運(yùn)營(yíng)商都會(huì)混合采用機(jī)械硬盤(pán)和固態(tài)硬盤(pán)。他們?cè)O(shè)計(jì)的存儲(chǔ)架構(gòu)由精心優(yōu)化的存儲(chǔ)介質(zhì)組合而成,考慮了支持的工作負(fù)載的成本、容量和性能要求。
隨著數(shù)據(jù)量的飆升,對(duì)機(jī)械硬盤(pán)和固態(tài)硬盤(pán)的需求將繼續(xù)居高,機(jī)械硬盤(pán)服務(wù)大容量工作負(fù)載,同時(shí),固態(tài)硬盤(pán)解決具有更高性能要求的工作負(fù)載。
數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)將成為促進(jìn)大容量機(jī)械硬盤(pán)需求的關(guān)鍵驅(qū)動(dòng)力,機(jī)械硬盤(pán)與閃存的協(xié)同作用將繼續(xù)支持現(xiàn)代工作負(fù)載。
硬盤(pán)繼續(xù)扮演關(guān)鍵角色
為了應(yīng)對(duì)所預(yù)測(cè)的數(shù)據(jù)存儲(chǔ)增長(zhǎng),硬盤(pán)必須在存儲(chǔ)容量方面做得更好,這意味著硬盤(pán)的面密度需要大幅增加。幸運(yùn)的是,硬盤(pán)行業(yè)一直在努力解決這個(gè)問(wèn)題,引入了新的技術(shù),如熱輔助磁記錄(HAMR),可以成倍地?cái)U(kuò)展碟片密度。希捷第一代HAMR硬盤(pán)每個(gè)碟片容量為3TB,相比之下,傳統(tǒng)PMR硬盤(pán)單碟片最高容量為2.4TB。預(yù)計(jì)未來(lái)幾代HAMR硬盤(pán)將進(jìn)一步將面密度提高到單碟片容量4TB或5TB。這相當(dāng)于在不久的將來(lái),我們將擁有40TB-50TB的大容量硬盤(pán)。
硬盤(pán)外形規(guī)格不變的情況下增加容量,這有利于數(shù)據(jù)中心輕松地在現(xiàn)有硬盤(pán)壽命結(jié)束時(shí)進(jìn)行更換,以最低的成本擴(kuò)展整個(gè)數(shù)據(jù)中心的存儲(chǔ)容量,且?guī)缀醪粫?huì)造成業(yè)務(wù)中斷。在多PB和EB規(guī)模上,將16TB的傳統(tǒng)PMR硬盤(pán)替換為30TB的HAMR硬盤(pán)可以顯著節(jié)省功耗和其他運(yùn)營(yíng)成本。
事實(shí)上,由于數(shù)據(jù)中心對(duì)耗電量和國(guó)家發(fā)電能力的影響,世界上許多國(guó)家都暫停了數(shù)據(jù)中心的部署。硬盤(pán)面密度的創(chuàng)新是許多數(shù)據(jù)中心運(yùn)營(yíng)商在有限資源下管理數(shù)據(jù)激增問(wèn)題的一個(gè)強(qiáng)有力解決方案。
規(guī)模上的可持續(xù)性
從規(guī)模上看,面密度創(chuàng)新使企業(yè)能夠在現(xiàn)有空間中找到更多空間。HAMR技術(shù)可以極大地增加數(shù)據(jù)中心的容量,而無(wú)需增加數(shù)據(jù)中心的占地面積和成本。
一般來(lái)說(shuō),面密度等于更環(huán)保的數(shù)據(jù)中心和更可持續(xù)的存儲(chǔ)。提高能源效率可減少數(shù)據(jù)中心對(duì)環(huán)境的影響和運(yùn)營(yíng)成本,同時(shí)從長(zhǎng)遠(yuǎn)來(lái)看,可以提高性能。同一數(shù)據(jù)中心占地面積內(nèi)的數(shù)據(jù)越多,意味著有功功率(每TB瓦數(shù))的大幅降低;它幫助企業(yè)可持續(xù)運(yùn)營(yíng)并實(shí)現(xiàn)其碳減排目標(biāo)。
結(jié)論
在人工智能的浪潮風(fēng)靡全球時(shí),當(dāng)前行業(yè)的目光主要聚焦在人工智能的顛覆性潛力、對(duì)人工智能處理器和計(jì)算引擎不斷增長(zhǎng)的需求、以及對(duì)云存儲(chǔ)容量的需求。然而,這往往忽略了云存儲(chǔ)實(shí)則依賴于硬盤(pán)而存在的事實(shí)。為了充分發(fā)揮人工智能的潛力,我們需要通過(guò)增加面密度來(lái)大幅增加硬盤(pán)的容量。隨著希捷開(kāi)始批量生產(chǎn)HAMR硬盤(pán),硬盤(pán)行業(yè)已做好準(zhǔn)備去應(yīng)對(duì)這一挑戰(zhàn)。