當下,數(shù)字化升級成為諸多行業(yè)領域重要發(fā)展趨勢,作為核心的技術驅(qū)動力,AIoT技術的深度賦能加快了行業(yè)數(shù)字化升級的步伐。AIoT推動著萬物互聯(lián)時代的到來,不過從萬物互聯(lián)到萬物智聯(lián),很大程度上也還依賴AIoT技術本身的升級迭代,算法、算力、數(shù)據(jù)的持續(xù)演進缺一不可。
從算力角度來看,AIoT的迅猛發(fā)展對芯片提出了更高的要求,主要表現(xiàn)在更高算力、高靈活性、高能效以及安全性這四大方面。
AIoT時代芯片的要求
高算力:隨著AI技術應用的不斷深化,越來越多的應用場景諸如智能視頻監(jiān)控、自動駕駛等需要實現(xiàn)實時的高速運算,這個過程非常依賴高算力的大力支持。
高靈活性:萬物互聯(lián)已成大趨勢,但也帶來了更復雜多樣的應用需求,面對海量且碎片化的應用需求,標準的專用芯片不僅研發(fā)成本高并且可適用場景也會受限,這就驅(qū)動了高靈活性芯片的應用需求。
高能效:很多AIoT設備的性能發(fā)揮往往會受限于使用環(huán)境、設備體積、電池容量等因素的影響,因此,提高芯片的能效也是提升設備性能的有效途徑。
安全性:萬物互聯(lián)趨勢下,設備安全、信息安全、隱私保護的建設也受到極大關注,這也是AIoT應用展開的前提。
摩爾定律增長放緩 可重構(gòu)計算芯片開啟新思路
眾所周知,計算芯片的性能提升很大程度上依賴于工藝集成的提升,隨著半導體工藝集成越來越接近物理極限,摩爾定律的增長已出現(xiàn)了明顯放緩趨勢,依賴工藝提升性能的思路,已經(jīng)不可持續(xù)。
與此同時,在人工智能領域,尤其隨著深度學習的興起,AI算力需求增長迅猛。據(jù)相關調(diào)研顯示,自2012年-2018年期間,初步統(tǒng)計,6年時間AI算力的增長已達30萬倍。
一邊是摩爾定律的逐步實效,另一邊是算力的迅猛增長,強烈的反差趨勢下,要實現(xiàn)芯片性能的大幅提升無疑需要開啟新的路徑,探索實踐新型體系架構(gòu)成為提高處理器性能的唯一出路。
如此背景之下,改變傳統(tǒng)芯片的指令驅(qū)動計算方式成為探索新型架構(gòu)芯片的重要入口。
近年來呼聲漸漲的可重構(gòu)計算芯片采用的是一種將指令流驅(qū)動處理器的功能靈活性和數(shù)據(jù)流驅(qū)動處理器的高能量效率(即性能功耗比) 結(jié)合在一起的計算方式,其在性能、功耗和功能靈活性等芯片的關鍵指標之間具有更好的平衡。
作為國內(nèi)可重構(gòu)計算芯片的領軍企業(yè),從清華大學出身的清微智能自2006年成立清華可重構(gòu)實驗室發(fā)展到目前,已在可重構(gòu)計算架構(gòu)技術方面積累了較為豐厚的經(jīng)驗,并從2015年起開始實踐將可重構(gòu)架構(gòu)應用在AI計算、神經(jīng)網(wǎng)絡計算場景,設計了一系列可重構(gòu)計算架構(gòu)的AI芯片,為智能安防、智能家居、智能可穿戴領域帶來了高能效、高靈活性的算力方案。
在四月下旬于深圳舉行的華南AI安防產(chǎn)業(yè)鏈對接會上,清微智能首席架構(gòu)師于義現(xiàn)場詳細講述了關于可重構(gòu)計算芯片的計算原理及其創(chuàng)新性和應用優(yōu)勢。
什么是可重構(gòu)計算架構(gòu)?
清微智能首席架構(gòu)師于義表示,可重構(gòu)架構(gòu)也可以稱之為軟件定義硬件架構(gòu)。
顧名思義,可重構(gòu)計算芯片采用的是不同于傳統(tǒng)芯片的計算方式,在具體計算原理上,于義解釋,可重構(gòu)計算架構(gòu)基本由可重構(gòu)的數(shù)據(jù)通路和可重構(gòu)的控制器兩部分組成。可重構(gòu)的數(shù)據(jù)通路是由可重構(gòu)的計算單元(PEA))構(gòu)成一個二維陣列,經(jīng)過配置后形成專用的數(shù)據(jù)通路來實現(xiàn)計算。
也就是說當我們將計算陣列配置成我們需要的算法,它將形成一個專用的數(shù)據(jù)通路,其運算方式也由此變成以數(shù)據(jù)流驅(qū)動的形式,代替了傳統(tǒng)的指令驅(qū)動方式。
“在運行時,根據(jù)數(shù)據(jù)流的特點,讓配置好的硬件資源互連形成相對固定的計算通路,以接近“專用電路”的方式進行計算,當算法和應用變換時,再次通過配置,重構(gòu)為不同的計算通路去執(zhí)行不同的任務。” 于義補充道。
簡而言之,可重構(gòu)計算架構(gòu)是一種全新的芯片架構(gòu)技術,可根據(jù)算法和應用的不同,靈活配置硬件資源,執(zhí)行不同的任務,同時具備通用芯片的靈活性和專用集成電路的高效性。
可重構(gòu)計算架構(gòu)的優(yōu)勢
眾所周知,傳統(tǒng)的計算架構(gòu)更多還是依賴于指令驅(qū)動的計算形式,比如需要把編輯好的程序以指令的形式存儲在存儲器中,等到用的時候再將程序提取出來,做一些云碼翻譯,最后再進行計算。
于義表示,這樣一來,取指和譯碼操作過程中會直接導致延時和能耗開銷,并且計算環(huán)節(jié)只占到整個計算過程的很小一部分,還不到5%。而可重構(gòu)計算架構(gòu)是在芯片中疊加了很多計算單元,可以使得芯片的很大部分算力可用來做計算,大大提升了芯片的計算能效。
并且傳統(tǒng)終端AI芯片通常基于CPU、GPU、DSP、NPU等架構(gòu),這些架構(gòu)屬于“指令驅(qū)動”的時域計算模式,在面向某一特定領域的計算過程,往往存在高能效和靈活性不兼得的問題。即使是目前計算能效最高的ASIC芯片,也因為是定制化芯片,所以在面對新的算法需求時可復制性一般,靈活性較低,同時研發(fā)成本也高。
清微智能推出的可重構(gòu)架構(gòu)芯片,相比CPU、GPU等通用芯片,可重構(gòu)計算架構(gòu)的能效明顯更高;相比專用集成電路(ASIC)的固定電路結(jié)構(gòu),它又可以根據(jù)應用或者算法進行電路配置,具有非常強的靈活性。
“可重構(gòu)架構(gòu)最大的優(yōu)勢體現(xiàn)在兩方面:一是沒有傳統(tǒng)指令驅(qū)動的計算架構(gòu)中取指和譯碼操作的延時和能耗開銷;二是在計算過程中以接近“專用電路”的方式執(zhí)行。此外,可重構(gòu)計算架構(gòu)算力可以彈性擴展,適用于從云端到邊緣端中對高能效和靈活性有綜合要求的場景。” 于義進一步強調(diào)。
隨著云計算、大數(shù)據(jù)、物聯(lián)網(wǎng)等技術的發(fā)展,需要芯片具有更強的算力。萬物智能孕育了巨大的市場需求,但這個市場呈現(xiàn)高度碎片化且需求多樣性,這就要求芯片能夠更靈活更高效,以適應不同的應用場景。同時,在對功耗敏感的場景下,依然能夠保持一個較高的算力,而可重構(gòu)計算正可以滿足這樣的需求。
兼顧了接近CPU可編程的靈活性的同時又能夠?qū)崿F(xiàn)接近ASIC芯片的高能效,可重構(gòu)架構(gòu)芯片的誕生可以說為AIoT產(chǎn)業(yè)的發(fā)展提供了全新的算力解決方案。
(本文根據(jù)華南AI安防產(chǎn)業(yè)鏈對接會上清微智能首席架構(gòu)師于義的主題演講整理)