人工智能、機器深度學習技術的發(fā)展和應用使圖像識別技術獲得了關鍵性的突破,不同應用場景的圖像識別率已經可以滿足各方面的應用要求,并開始逐步應用于身份識別、商品識別、金融支付、安全防范、智能安檢等諸多領域,呈現(xiàn)出高速發(fā)態(tài)展勢,使視頻監(jiān)控系統(tǒng)的功能和效能出現(xiàn)質的飛躍,而這些智能功能的實現(xiàn)都離不開算力的支持。
主流的智能運算如果全部依賴云端大規(guī)模GPU服務器集群,其高昂的運營成本就會讓大多用戶無法承擔。邊緣計算作為5G和高清時代非常重要的網絡組成部分,主要價值在于減少超大流量對網絡的消耗,同時為各種應用提供低延時和開放的網絡能力。相比于傳統(tǒng)集中部署的云計算,邊緣計算在靠近數(shù)據(jù)源或用戶的地方提供計算能力不失為明智的選擇。a&s本次測試的比特大陸SE5 AI計算盒是基于芯片和模組,但比模組形態(tài)的產品面向場景更加廣泛的高性能、低功耗邊緣計算產品,搭載比特大陸自主研發(fā)的第三代TPU芯片BM1684,INT8算力高達17.6TOPS,可同時處理16路高清視頻,為諸多安防、泛安防、教育、金融、安檢、雪亮工程等行業(yè)項目智能運算提供算力。
工業(yè)級標準設計
比特大陸SE5 AI計算盒尺寸只有188mm×148mm×44.5mm(長×寬×高),小巧嚴謹,盒子上部有工業(yè)級散熱齒, 可適應工作溫度為-20℃ ~ +60℃(具體視配置而定),工業(yè)級寬溫設計,可以適應嚴苛的工作環(huán)境,在復雜條件下進行邊緣側智能分析。
該設備包含USB3.1×2、 MicroSD ×1 、 HDMI ×1、 RS-232×1 、RS-485 ×1、I/O ×4、自適應10/100/1000Mbps網口×2等接口,接口豐富,使得產品可以面向的場景更加豐富、靈活。內置12GB內存,市場上的同類產品基本為8GB,可以說是高規(guī)格配置。
無線傳輸 部署靈活
比特大陸SE5 AI計算盒內置4G卡槽,支持LTE無線回傳,在網絡布線不方便的室內外環(huán)境,可以直接使用無線傳輸,方便用戶便捷安裝部署。
計算盒內置SATA接口,用戶可以直接添加硬盤,可靈活應用在小型利舊項目或者有存儲需求的小型安防項目中。目前市場上的同類的AI計算盒大多不具備存儲功能,而具有存儲功能的盒子又體積較大,部署不夠靈活方便。比特大陸SE5 AI計算盒子在外觀、體積、算力性能優(yōu)異的情況下,還可以外接硬盤的設計,非常便于用戶未來應用的擴容,優(yōu)勢不言而喻。
算力優(yōu)勢明顯
AI計算的核心是芯片,邊緣計算盒產品的主芯片選定后,其計算能力基本可以確定,比特大陸SE5 AI計算盒是基于其自主研發(fā)的BM1684芯片,比特大陸深耕芯片產品多年,BM168X系列芯片已經第三次流片,經過了充分的市場檢驗,滿足所有邊緣側推理需求。
算力作為最為主要的AI芯片評判標準,只看廠家的標稱算力并不能準確的去評定產品。在實際的應用中,標稱只能作為輔助的判斷尺,采用標準算法模型進行圖片分析,實際的圖片分析能力對用戶來說才是實實在在的收益。
a&s本次測試采用業(yè)界標準測試模型,因各個芯片支持的量化精度不同,有FP32、 INT16、INT8等。這里采用各顆芯片同時支持的INT8做橫向對比。原始數(shù)據(jù)即是在常見標準模型下的實測結果。將BM1684與TX2、Hi3559A、Atlas200等市場常見芯片對比測試,實際測試結果如下。
Mobilenet是輕量級模型,針對產品主要應用在手機或者移動端較多,目前數(shù)據(jù)可以超過2500張/秒。Resnet 50典型模型測試中,圖片處理達到914.9張/秒。從評測對比數(shù)據(jù)來看,BM1684的處理能力普遍超過Atlas200 50%以上,而與其上一代的Hi3559A相比,更是超出其處理能力5倍以上。正是得益于強大的算力,所以SE5 AI計算盒才能在典型人臉識別算法下做到至少實時16路全流程比對。
目前業(yè)界許多AI產品標稱的AI分析路數(shù)一般只是指人臉檢測,并不包含圖像識別功能,而比特大陸的單路計算包含了人臉檢測,人臉特征值提取和識別、人臉比對,即人臉全流程比對。
性價比之王 單路AI成本最低
從TX2、Hi3559A、Atlas200、BM1684四種市場常見芯片對比測試結果來看,不同的測試模型,BM1684與TX2相比有5.4-22.9倍級別的性能優(yōu)勢。相比Atlas200,雖然理論峰值標稱算力BM1684和Atlas200很接近(17.6T vs 16T),但是從實測來看,BM1684的性能倍數(shù)在最典型Resnet 152上有1.4倍的優(yōu)勢,在Mobilenet上有2.36倍的優(yōu)勢!這說明,標稱算力和實際獲得的算力具有一定的差別。BM1684具有較高的有效計算利用率。相應的,基于BM1684芯片的比特大陸SE5 AI計算盒實際計算有效利用率也在同等水平。
在以上公開測試數(shù)據(jù)中,與業(yè)界主流的AI盒子相比,INT8的算力在同類產品中可以說達到最高。結合產品性能和價格,比特大陸SE5 AI計算盒的單路成本競爭力強大,可以稱為業(yè)內性價比之最。
除了算力、功耗,量化精度是另外一個重要評判指標,精度降低后,在有限的芯片面積下可以得到更大的算力,比特大陸的AI計算盒采用自研芯片是產品在實際應用中能夠發(fā)揮更大作用的原因。
軟件生態(tài)完備 百度認證授權合作
對于AI芯片來講,更需要為開發(fā)者提供完備,可靠的工具鏈和系統(tǒng)軟件。比特大陸在這個領域耕耘多年,隨著AI芯片已經發(fā)展到第三代,相應的工具鏈也非常成熟,所有的產品線保持統(tǒng)一的編譯工具鏈,經過多個合作客戶檢驗。
市面上常見的AI計算盒劣勢就在于支持的框架少,比特大陸SE5 AI計算盒采用的芯片支持Tensorflow、PyTorch、MXNet、 Caffe等多種深度學習框架,同時對于國產深度學習框架,也有完善的支持。2020年3月24日,百度宣布,比特大陸的算豐BM168X系列AI芯片,已經通過百度飛槳的輕量化推理引擎Paddle Lite的兼容性驗證。這意味著百度所有生態(tài)合作伙伴可以直接采用百度框架和算法移植,不存在任何兼容性問題。目前國家政策支持硬件、軟件的國產化,百度Paddle深度學習框架是國產化中具有優(yōu)勢的企業(yè),比特大陸與百度合作,實現(xiàn)軟硬件的同時國產化,在國內具有發(fā)展優(yōu)勢。
比特大陸SE5 AI計算盒隨機配套BMNNSDK一站式工具包,提供底層驅動環(huán)境、編譯器、推理部署工具等一系列軟件工具。幫助開發(fā)者快速高效的在SE5上部署深度學習算法應用。BMNNSDK最大程度降低算法和軟件的開發(fā)周期和成本,使用者能快速在算豐各系列AI硬件產品上部署深度學習算法,便捷實現(xiàn)智能應用。
應用領域廣泛
比特大陸SE5 AI計算盒是基于邊緣計算的小微型服務器,不論算法類型,基本可以支持各個行業(yè)的算法,通過完備的生態(tài)方便用戶將訓練好的模型移植,不光支持人臉識別算法模型,還支持數(shù)十種輔助模型,所以面向場景非常廣泛??梢詰迷趫@區(qū)、社區(qū)、商業(yè)樓宇等室內外場景,以及集成類室外半封閉場景,不需要依托X86架構服務器,充分利用其內部ARM資源,直接獨立一體化開發(fā)應用。
該計算盒的算力性能高,市場競爭力強,但同樣保留了一部分高精度的算力。在需要高精度算力的場景,保留了高精度優(yōu)勢,如動態(tài)視覺無人零售柜、智慧冰箱系統(tǒng)中商品識別等。
SE5實際可應用場景如,作為邊緣人臉服務器布置在園區(qū),進行園區(qū)通行識別比對或園區(qū)監(jiān)控;在智慧食堂進行人臉支付;在家?;ヂ?lián)系統(tǒng)做學生人臉識別;在學校宿舍系統(tǒng)做出入管理;在餐飲系統(tǒng)中植入菜品識別算法進行菜品結算;替代傳統(tǒng)安檢人員識圖,機器判圖準確度更高、降低安檢員培訓成本,通行速度更快,實現(xiàn)智能輔助安檢??梢灾踩氲乃惴P投喾N多樣,從而實現(xiàn)應用場景的多樣化。
產品特色
1、強勁算力:高達17.6T的INT8峰值算力或2.2T的FP32高精度算力。
2、超高性能:16路高清視頻處理能力,38路1080P硬件解碼與2路編碼。
3、快速移植:支持Caffe/TensorFlow/Pytorch/Mxnet/Paddle Lite等主流深度學習框架。
4、接口豐富:持USB、HDMI、RS-485、RS-232、SATA、自定義I/O等多種接口
5、寬溫設計:適應溫度-20℃至+60℃。支持無風扇被動散熱。
6、應用場景豐富:支持智慧園區(qū)/安防/工控/商業(yè)等多領域多場景靈活部署。
點評
人工智能的需求貫穿了從端邊云到整個網絡,基于視覺的人工智能應用場景最豐富、市場需求最旺盛,而邊緣端的計算需求又比云端多一個數(shù)量級,所以安全和實時響應的邊緣端智能分析成為發(fā)展的必然趨勢。
比特大陸在芯片行業(yè)深耕多年,BM168X系列經受住了市場的考驗,SE5 AI計算盒是基于第三代TPU芯片BM1684研發(fā)的AI產品,更是具有了這個芯片的特性。INT8算力高達17.6TOPS,在具有高算力的同時保持了低功耗、被動式散熱、接口豐富、軟件生態(tài)完備等優(yōu)勢,算法移植便捷,不光支持人臉識別算法模型,還支持數(shù)十種輔助模型,所以可面向應用場景非常廣泛,是一款性價比非常高的邊緣智能分析設備。
主要規(guī)格參數(shù)
TPU BM1684 峰值算力:17.6 TOPS (INT8) / 2.2 TFLOPS (FP32)
CPU 8核 ARM A53 2.3GHz
典型功耗 ≤20W
視頻解碼 960FPS 1080p(38路1080P@25FPS)
視頻編碼 50FPS 1080p(2路1080P@25FPS)
接口 USB3.1 *2 / MicroSD *1 / HDMI *1 / RS-232 *1 / RS-485 *1 / I/O *4