在近日 Nature Electronics 期刊上發(fā)表的一篇論文中,IBM 研究人員描述了這種新的 “混合精度內(nèi)存計(jì)算” 方法。
根據(jù)IBM Research 的說(shuō)法,這種內(nèi)存計(jì)算新方法,可以為微軟和谷歌尋求的高性能和機(jī)器學(xué)習(xí)應(yīng)用的硬件加速器提供答案。該方法被稱(chēng)為“混合精度內(nèi)存計(jì)算”。
據(jù) IBM 稱(chēng),這種被稱(chēng)為 “馮·諾依曼” 的體系結(jié)構(gòu)設(shè)計(jì),為數(shù)據(jù)分析和機(jī)器學(xué)習(xí)應(yīng)用制造了一個(gè)瓶頸,這些應(yīng)用需要在處理單元和內(nèi)存單元之間進(jìn)行更大的數(shù)據(jù)傳輸,傳輸數(shù)據(jù)也是一個(gè)耗能的過(guò)程。
為應(yīng)對(duì)這一挑戰(zhàn),IBM 給出的一種方法是模擬相變內(nèi)存(PCM)芯片,該芯片目前還處于原型階段,500 萬(wàn)個(gè)納米級(jí) PCM 器件組成 500×2000 交叉陣列。
據(jù) IBM 稱(chēng),研究表明在某些情況下,其 PCM 芯片能夠以模擬的方式進(jìn)行操作,執(zhí)行計(jì)算任務(wù),并提供與 4 位 FPGA 存儲(chǔ)器芯片相當(dāng)?shù)臏?zhǔn)確度,但能耗降低了 80 倍。
模擬 PCM 硬件并不適合高精度計(jì)算。所幸的是,數(shù)字型 CPU 和 GPU 是適合的,IBM 認(rèn)為混合架構(gòu)可以實(shí)現(xiàn)更高性能、更高效率和更高精度的平衡。這種設(shè)計(jì)將大部分處理留給內(nèi)存,然后將較輕的負(fù)載交給 CPU 進(jìn)行一系列的精度修正。
根據(jù) IBM 蘇黎世實(shí)驗(yàn)室的電氣工程師、也是該論文的主要作者 Manuel Le Gallo 稱(chēng),這種設(shè)計(jì)有助于云中的認(rèn)知計(jì)算,有助于釋放對(duì)高性能計(jì)算機(jī)的訪(fǎng)問(wèn)。