AI不得不面對(duì)的難題
在上屆北京安博會(huì)上,讓人感覺不談人臉不好意思說自己來參展,而這屆徹徹底底變成不談AI都很難吸引觀眾的眼球。據(jù)了解在國(guó)內(nèi),阿里巴巴、海康威視、華為、大華股份、蘇州科達(dá)、宇視、東方網(wǎng)力、天地偉業(yè)等廠商已經(jīng)推出了覆蓋視頻分析、人臉識(shí)別、智慧交通等領(lǐng)域的安防解決方案,不斷讓GPU的強(qiáng)大處理能力滲透至城市安全的各個(gè)領(lǐng)域。
AI在安防落地雖然是趨勢(shì),但目前也暴露出不少的問題,從技術(shù)角度而言有以下幾點(diǎn):
其一,當(dāng)前基于“CPU+GPU”的計(jì)算模型已經(jīng)被廣泛運(yùn)用于各種深度學(xué)習(xí)中去,但其本質(zhì)而言,其實(shí)CPU與GPU均是利用相關(guān)成熟的技術(shù)提供一種通用級(jí)的解決方法來滿足深度學(xué)習(xí)的要求,雖然諸如英特爾(Intel)及英偉達(dá)(NVIDIA)不斷在推出新的加速芯片來完善自身的深度學(xué)習(xí)方案,但這也不能掩蓋其缺乏針對(duì)專業(yè)應(yīng)用解決方案的事實(shí);
其二,當(dāng)前深度學(xué)習(xí)的算法僅僅滿足于特定的理想場(chǎng)景,例如空間限制等,但同樣的產(chǎn)品放在不同場(chǎng)景下,其表現(xiàn)能力其實(shí)具有較強(qiáng)的局限性,這其中也有算法的困難,例如近距離與遠(yuǎn)距離場(chǎng)景的差異等;
其三,能效問題,目前的深度學(xué)習(xí)模型訓(xùn)練中,雖然可以實(shí)現(xiàn)一條指令實(shí)現(xiàn)大批數(shù)據(jù)的平行處理,但在平臺(tái) 完成訓(xùn)練之后,需要進(jìn)行的推理環(huán)節(jié)的計(jì)算,這部分卻跟前者完全不同,無法實(shí)現(xiàn)單指令完成。而據(jù)估計(jì),未來有95%的深度學(xué)習(xí)將用于推理,只有不到5%的資源用于模型訓(xùn)練,尋找低功耗、高性能的加速硬件成為當(dāng)務(wù)之急。
FPGA能否彌補(bǔ)GPU的不足
在GPU方案無法滿足未來需求的情況下,人們逐漸把目光投向了“FPGA” (Field-Programmable Gate Array,即現(xiàn)場(chǎng)可編程門陣列)。但如果沒有深耕安防行業(yè)的相關(guān)方案,恐怕也會(huì)重蹈GPU之路??上驳氖窃诎卜佬袠I(yè)中,去年鮮見的該類型解決方案供應(yīng)商,今年在安博會(huì)上有了代表,一下子吸引了眾人的眼球——深鑒科技。
談起這家企業(yè),筆者也是陌生的,唯一的印象是在前不久螞蟻金服領(lǐng)投的融資信息上看過這家企業(yè)。帶著GPU存在的弊端及對(duì)其好奇心,采訪了深鑒科技創(chuàng)始人&CEO姚頌,探討FPGA在行業(yè)未來應(yīng)用的前景。
(1)深鑒是誰?能干什么?
“深鑒科技是一家清華系背景的深度學(xué)習(xí)解決方案開發(fā)商,其核心一是深度壓縮技術(shù)(Deep Compression),讓算法模型更小,延遲更短、功耗更少,二是DPU硬件設(shè)計(jì)能力,為深度學(xué)習(xí)提供端到端的軟硬件結(jié)合解決方案?!币灲榻B。
筆者在現(xiàn)場(chǎng)看到的產(chǎn)品包括網(wǎng)絡(luò)攝像機(jī)的板卡模組、以及針對(duì)NVR及服務(wù)器視頻結(jié)構(gòu)化及人臉識(shí)別的硬件方案等產(chǎn)品,姚頌介紹,深鑒主要解決的是人工智能平臺(tái)落地難的問題,其解決方案主要針對(duì)特定領(lǐng)域的計(jì)算需求進(jìn)行體系結(jié)構(gòu)上裁剪和優(yōu)化設(shè)計(jì),能夠使其獲得比通用處理器體系結(jié)構(gòu)更優(yōu)秀的性能、更高的能效?!爱?dāng)前攝像機(jī)會(huì)用到兩類平臺(tái),一類是英特爾Movidius的DSP和ARM陣營(yíng),另一類是英偉達(dá)TX1/TK1 GPU,但前者性能不強(qiáng),僅僅能完成簡(jiǎn)單的算法,后者功耗太高。因此我們選擇了折衷的方式,讓智能化產(chǎn)品落地的同時(shí)保證性能、低功耗及穩(wěn)定性?!?/p>
(2)與之前的AI初創(chuàng)型企業(yè)有什么不同?
姚頌通過在核心能力的研究方向,總結(jié)深鑒的獨(dú)特性?!拔覀児靖M(jìn)入到安防行業(yè)已經(jīng)有一段時(shí)間的商湯、曠視、依圖、云從的定位完全不同,他們的核心能力是算法設(shè)計(jì)能力,具體表現(xiàn)為它們的人臉識(shí)別算法在世界比賽取得的成績(jī)等等,這些是他們的核心能力。但深鑒核心的能力主要分為兩部分:一是算法壓縮,幫助客戶實(shí)現(xiàn)深度學(xué)習(xí)算法壓縮幾倍到幾十倍的服務(wù),用戶可以實(shí)現(xiàn)根據(jù)場(chǎng)景定義不同的算法,讓客戶減少前端的壓力,同時(shí)設(shè)備也能運(yùn)行得更快;二是深度學(xué)習(xí)處理器的設(shè)計(jì)能力(DPU),我們?cè)谇迦A、斯坦福已經(jīng)積累了許多年芯片結(jié)構(gòu)/指令級(jí)的設(shè)計(jì),能實(shí)現(xiàn)比GPU功耗要低于幾十倍,性能一樣的產(chǎn)品?!? 他認(rèn)為深鑒與商湯、曠視及應(yīng)用設(shè)計(jì)企業(yè)之間是互補(bǔ)的關(guān)系,未來也定位在平臺(tái)公司,既不碰應(yīng)用,也不會(huì)進(jìn)入到項(xiàng)目市場(chǎng)中去。以單純地提供模組服務(wù),幫助安防行業(yè)的企業(yè)繼續(xù)保持競(jìng)爭(zhēng)優(yōu)勢(shì)。
(3)這會(huì)是直接對(duì)標(biāo)英偉達(dá)嗎?
從某種程度上而言,芯片業(yè)巨頭英偉達(dá)曾率先推出深度學(xué)習(xí)軟件包 TensorRT,在深度學(xué)習(xí)算法推理階段能將GPU的計(jì)算能力更大程度釋放出來,相對(duì)簡(jiǎn)單易用。而深鑒科技自主研發(fā)的DNNDK((Deep Neural Network Development Kit)),即對(duì)標(biāo)英偉達(dá)的 TensorRT 產(chǎn)品。
“從整個(gè)產(chǎn)品的技術(shù)特點(diǎn)而言,我們的產(chǎn)品與英偉達(dá)確實(shí)有類似的地方,他們有GPU,我們有DPU,他們有TensorRT,我們有DNNDK,但我們?cè)跇I(yè)務(wù)場(chǎng)景上是有區(qū)別的,英偉達(dá)的產(chǎn)品往往沒有具體細(xì)分到行業(yè)上,它提供的板卡既可以用于PC也可以用于監(jiān)控,沒有為行業(yè)定制方案,我們更加傾向于結(jié)合具體行業(yè),而不是以撒網(wǎng)的方式向所有行業(yè)布局?!币灲忉尅?/p>
(4)FPGA那么貴,安防會(huì)選擇嗎?
安防廠商對(duì)于FPGA的最初印象大都停留在價(jià)格昂貴及開發(fā)難度大的層面上,GPU的迅速發(fā)展也讓人們忘記了它的好處——靈活多變且功耗低,這也與當(dāng)前行業(yè)興起的邊緣計(jì)算不謀而合,在看清GPU存在的問題之后,F(xiàn)PGA相信會(huì)獲得更多的關(guān)注。
據(jù)相關(guān)資料顯示,浪潮與Intel 于去年底FPGA加速卡 F10A 最高性能的加速卡,單芯片峰值運(yùn)算能力達(dá)到1.5TFlops,功耗才35W,每瓦特功率42GFlops,是GPU的數(shù)倍之高。
“FPGA開發(fā)周期長(zhǎng),難度大,我們公司希望把這些問題都解決掉,所以我們軟件、模組等產(chǎn)品都非常的簡(jiǎn)單易用,舉個(gè)例子只要有C++基礎(chǔ)的人,基本一周之內(nèi)能學(xué)會(huì)使用我們的工具鏈,可以做自己的算法意識(shí)。由于深鑒會(huì)統(tǒng)一提供深度學(xué)習(xí)的模組方案,客戶便不再需要單獨(dú)購(gòu)買FPGA,加上賽靈思(Xilinx,世界最大的FPGA芯片廠商)也是我們的投資方,得到他們的支持,客戶最終拿到的價(jià)格也會(huì)比較合理。在解決了簡(jiǎn)單易用及價(jià)格因素的問題之后,用戶自然沒有選擇的困難性?!币灮卮稹?/p>
FPGA與GPU公司在風(fēng)格上也存在著異同,這點(diǎn)類似于傳統(tǒng)企業(yè)與互聯(lián)網(wǎng)企業(yè)一樣,前者較為保守(喜歡把雞蛋放在多個(gè)籃子),后者往往更加激進(jìn)(喜歡孤擲一注),因此后者在產(chǎn)品的更新速度上往往會(huì)比前者更快。賽靈思看到這點(diǎn)的不足,于是選擇了投資深鑒科技,讓其不僅在芯片設(shè)計(jì)能力上進(jìn)行優(yōu)化,也通過模型壓縮的方式,實(shí)現(xiàn)更天然有效的方式去快速迭代。
(5)完成融資后,有什么規(guī)劃?
近期,深鑒科技完成4000萬美元的A+輪融資。而現(xiàn)在,它也出現(xiàn)在安博會(huì)上,這也意味這個(gè)新面孔必然會(huì)在行業(yè)內(nèi)“搞事情”。
對(duì)于融資后的規(guī)劃,姚頌表示未來將從兩個(gè)方面強(qiáng)化在安防行業(yè)的布局:一是通過團(tuán)隊(duì)建設(shè),摸清行業(yè)脈路,真正讓企業(yè)扎根進(jìn)入行業(yè)中來,讓人工智能在安防的落地更高效率;二是實(shí)現(xiàn)芯片在未來三年的更新?lián)Q代計(jì)劃,如明年上半年我們會(huì)推出第一套基于自身研發(fā)的聽濤芯片方案,下半年便會(huì)計(jì)劃推出迭代第二代芯片,實(shí)現(xiàn)服務(wù)的升級(jí)。
(6)如何合作,技術(shù)要求如何
對(duì)于合作方面,姚頌表示深鑒因?yàn)樽陨矶ㄎ环浅G逦斯ぶ悄芗铀俜桨柑峁┥?,既不做設(shè)備和集成,也沒有計(jì)劃做政府如智慧城市等項(xiàng)目。希望通過提供方案,跟更多安防廠商合作,實(shí)現(xiàn)人工智能在各個(gè)場(chǎng)景運(yùn)用起來。
姚頌介紹,開發(fā)技術(shù)能力較弱的企業(yè)只需提供調(diào)試接口,便能產(chǎn)品從軟到硬實(shí)現(xiàn)人工智能。而具有開發(fā)能力的企業(yè),也可以通過深鑒的軟件,將自己算法與運(yùn)用更好結(jié)合起來。
百花齊放才是春
對(duì)于當(dāng)前AI方案的選擇性上,各家技術(shù)大同小異。而FPGA的出現(xiàn)也能讓其落地更加的高效、靈活、低功耗、低成本,必然能讓行業(yè)的AI化更別具一番風(fēng)采,這或許是未來一年安防行業(yè)最重大的變化。