在上兩期中,我們?yōu)榇蠹医榻B了FPGA與DSP含義、種類、原理、特點(diǎn)以及兩者性能的比較等內(nèi)容,那么本期我們將繼續(xù)為大家介紹FPGA與DSP二者在智能安防監(jiān)控中的應(yīng)用情況,希望喜歡。
DSP與FPGA在智能安防監(jiān)控中的應(yīng)用
在短短的十多年時(shí)間,DSP與FPGA芯片已經(jīng)在信號處理、通信、雷達(dá)等許多領(lǐng)域得到廣泛的應(yīng)用。目前,芯片的價(jià)格也越來越低,性能價(jià)格比日益提高,具有巨大的應(yīng)用潛力。下面僅簡略地舉例介紹一下這兩種芯片在智能安防監(jiān)控中的應(yīng)用。
DSP在智能安防監(jiān)控中的應(yīng)用
1、DSP在智能視頻監(jiān)控中的應(yīng)用
在現(xiàn)代的攝像機(jī)中,DSP技術(shù)得到了廣泛的應(yīng)用,因?yàn)榻?jīng)固體圖像傳感器光電轉(zhuǎn)換產(chǎn)生的信號不僅很弱,而且有圖像細(xì)節(jié)信號弱、亮度不均勻、彩色不自然等缺陷。因此,必須經(jīng)過視頻信號處理放大器進(jìn)行放大和校正,這樣就嵌入了DSP芯片作數(shù)字信號處理,因而市場上出現(xiàn)了很多DSP攝像機(jī),這就是普通型DSP攝像機(jī)。為了進(jìn)一步提高攝像機(jī)性能,如用來提高攝像機(jī)動態(tài)范圍、作降噪處理、自動聚焦等,也用DSP芯片作進(jìn)一步地處理,從而又出現(xiàn)了如松下等公司的功能型的智能DSP攝像機(jī)。
在平安城市建設(shè)中,尤其在安防監(jiān)控系統(tǒng)由數(shù)字化、網(wǎng)絡(luò)化向智能化發(fā)展的進(jìn)程中,除編碼壓縮技術(shù)需采用DSP芯片外,智能化的一些智能功能軟件,大多要嵌入DSP芯片作算法處理。并且,將已嵌入智能軟件的DSP芯片,嵌入攝像機(jī),則稱為檢測識別型的智能攝像機(jī)。若將已嵌入智能軟件的DSP芯片,分別置入DVR與DVS中,則可出現(xiàn)智能網(wǎng)絡(luò)DVR與智能網(wǎng)絡(luò)DVS等智能視頻監(jiān)控系統(tǒng)的產(chǎn)品形態(tài)。所以,DSP芯片不僅大量應(yīng)用在普通監(jiān)控系統(tǒng)中,而且還將大量應(yīng)用在智能視頻監(jiān)控系統(tǒng)中。
2、用DSP實(shí)現(xiàn)MPEG-4等編碼技術(shù)
MPEG-4與H.264是常用的、較好的編碼壓縮技術(shù),這用DSP很容易嵌入實(shí)現(xiàn)。美國模擬器件公司(ADI)推出三款最新Blackfin系列處理器ADSP-SF533、ADSP-BF531及ADSP-BF533,其性能是傳統(tǒng)DSP和嵌入式處理器的兩倍,而功耗僅為它們的一半。如ADSP-BF533具有600MHz時(shí)鐘頻率和1.2GMACS(每秒十億次乘法累加運(yùn)算)運(yùn)算速度。這些DSP兼具業(yè)界一流的數(shù)字信號處理性能和微處理器(MCU)功能,并且支持嵌入式操作系統(tǒng)以滿足當(dāng)今嵌入式音頻、視頻和通信應(yīng)用對高速運(yùn)算和低功耗的要求。ADSP-BF533在達(dá)到600MHz性能水平時(shí)的功耗僅為280mW。這些新型DSP支持Linux、ThreadX和Nucleus等嵌入式操作系統(tǒng),能很容易支持新興的多媒體格式,如MPEG-4、H.264和Windows Media。它們還提供一些新的外圍電路,包括與一系列ITU-R656視頻編碼器和解碼器,以及65MSPS(每秒百萬次采樣)高速模數(shù)轉(zhuǎn)換器(ADC)和數(shù)模轉(zhuǎn)換器(DAC)的無縫連接。該系列所有產(chǎn)品中創(chuàng)新的二維直接存儲器存?。―MA)結(jié)構(gòu)支持其專用視頻端口,從而極大地降低了實(shí)時(shí)視頻應(yīng)用的軟件開銷和系統(tǒng)功耗。Blackfin的DSP系列采用C和C++語言編程,能有效地執(zhí)行信號處理和控制指令。[nextpage]
3、基于DSP的多路音/視頻采集處理系統(tǒng)
采用DSP,可設(shè)計(jì)多路音/視頻采集處理系統(tǒng)。這種系統(tǒng)可實(shí)時(shí)處理4路模擬視頻和音頻輸入、l路模擬/數(shù)字視頻和1路模擬音頻信號輸出,適應(yīng)PAL/NTSC標(biāo)準(zhǔn)復(fù)合視頻CVBS或分量視頻Y/C格式的模擬信號輸入,可適應(yīng)PAL/NTSC標(biāo)準(zhǔn)S端子或數(shù)字RGB模擬/數(shù)字信號輸出,可適應(yīng)標(biāo)準(zhǔn)麥克風(fēng)或立體聲音頻模擬輸入及標(biāo)準(zhǔn)立體聲音頻模擬輸出,具有對多路采集數(shù)據(jù)進(jìn)行實(shí)時(shí)處理和分析的功能,可實(shí)現(xiàn)數(shù)據(jù)和圖像疊加顯示。如用TMS320 DM642型DSP即可完成上述任務(wù),它采用500MHz或600MHz的工作頻率,每秒最多可完成4.8G次操作,且具備在線編程功能,所帶有的豐富外圍接口可以與多種存儲器相連,可以直接與網(wǎng)絡(luò)連接,是高速圖像處理的優(yōu)選器件?;谶@種DSP的多路音/視頻采集處理系統(tǒng)能夠同時(shí)處理4路CIF格式的數(shù)字視頻,并且可以動態(tài)切換,總采樣速率可達(dá)100幀/秒,每路速率為25幀/秒,可以完全保證圖像實(shí)時(shí)采集,從而廣泛應(yīng)用于機(jī)頂盒、IP可視電話、網(wǎng)絡(luò)視頻會議等領(lǐng)域。
FPGA在智能安防監(jiān)控中的應(yīng)用
1、FPGA在智能視頻監(jiān)控中的應(yīng)用
由于平安城市建設(shè)的需要,更加推動了視頻監(jiān)控的發(fā)展,從而也推動了FPGA在這一領(lǐng)域的應(yīng)用。尤其現(xiàn)在要求多通道、高清晰、網(wǎng)絡(luò)化、通信接口高速化、智能化,都促進(jìn)了FPGA在這一領(lǐng)域的進(jìn)一步發(fā)展。反之,F(xiàn)PGA的芯片技術(shù)、IP核、參考設(shè)計(jì)的進(jìn)步和更新,又推動了視頻監(jiān)控的發(fā)展?,F(xiàn)在,單純采用DSP處理器或現(xiàn)成芯片(ASSP)的方法已難以滿足高性能系統(tǒng)的需求。但由于目前可編程器件具有很高的集成度和靈活性,以及低功耗和寬泛的工作范圍,其價(jià)格又不斷在下降,因此利用可編程邏輯門陣列(FPGA)特有的高性能和靈活性,使其可構(gòu)建許多視頻監(jiān)控產(chǎn)品。
目前,IP攝像機(jī)的分辨率正在由標(biāo)清D1逐步進(jìn)化到高清(1280×1024),并且必須進(jìn)行本地實(shí)時(shí)壓縮,因而只能采用硬壓縮方式。如果采用多片DSP處理器,則將使系統(tǒng)成本、集成度和功耗增加,而讓用戶無法接受;如果采用單片低成本的FPGA器件,則性能又無法滿足設(shè)計(jì)要求。但若采用單片高性能的Stratix系列FPGA器件,則可達(dá)到要求。因?yàn)檫@種器件是具有相對應(yīng)的結(jié)構(gòu)化ASIC-Hard-Copy系列器件,還可進(jìn)一步將成本降低到1/10,并降低50%的功耗。因此,可采用這種FPGA器件作單路高清IP攝像機(jī),欲知詳情可參閱本人撰寫在AS《安防工程商》中“用于平安城市的智能網(wǎng)絡(luò)攝像機(jī)的實(shí)現(xiàn)方案”一文,其1路1280×1024/25幀/s+1路CIF/25幀/s與H.264視頻壓縮均將在FPGA硬件中實(shí)現(xiàn)。
軟壓縮DVR所實(shí)現(xiàn)的功能大多邏輯復(fù)雜度不高,同時(shí)對數(shù)據(jù)通路性能有一定的要求,需要具有高速接口通信能力,因而也適合用FPGA來實(shí)現(xiàn)。其縮放部分以及視頻濾波等預(yù)處理工作、DMA控制器、音頻FIFO和PCI-E部分可全部放入FPGA中。這里采用FPGA的好處是,可以靈活地實(shí)現(xiàn)任意多路的視頻輸入,并且視頻預(yù)處理的功能可以根據(jù)不同攝像機(jī)的特性靈活定制,從而達(dá)到最優(yōu)效果。
硬壓縮,是指采用硬件(如DSP處理器、媒體處理器和FPGA器件)來實(shí)現(xiàn)視頻壓縮,然后直接存貯或通過網(wǎng)絡(luò)傳送等。而從成本和易實(shí)現(xiàn)性等方面考慮,高端Stratix系列FPGA更適合H.264高清分辨率壓縮。多路硬壓縮DVR的通道數(shù)包含4、8、16通道,有的甚至超過24通道。系統(tǒng)的核心是多通道壓縮,用FPGA實(shí)現(xiàn)方案與傳統(tǒng)的ASSP或DSP處理器實(shí)現(xiàn)方法不同,它是一種更靈活、可擴(kuò)展性更強(qiáng)、單路視頻成本和功耗更低的解決方案。最新的65nm低成本FPGA CycloneⅢ在功耗方面擁有很大優(yōu)勢,這種單芯片可以支持最大到16通道的H.264編碼。欲了解用FPGA實(shí)現(xiàn)硬壓縮與軟壓縮DVR的,可參閱本人撰寫在AS《安防工程商》中“智能網(wǎng)絡(luò)DVR的實(shí)現(xiàn)方案”一文。
為了能在本地監(jiān)視多通道的畫面,通常需要復(fù)用多通道視頻數(shù)據(jù)和對畫面進(jìn)行分割與縮放,因此,必須將標(biāo)準(zhǔn)的CCIR656格式數(shù)據(jù)送入視頻復(fù)用縮放分割部分處理。FPGA CycloneⅢ器件中豐富的M9K內(nèi)存資源較適合用作視頻復(fù)用縮放算法時(shí)必需的行緩存,從而這部分能快速實(shí)現(xiàn)畫面復(fù)用縮放及分割功能。然后送入多通道H.264 D1+CIF編碼部分,而FPGA內(nèi)在的強(qiáng)大并行處理能力可以滿足H.264算法對處理速度的要求。這與多個(gè)ASSP或DSP處理器實(shí)現(xiàn)方案相比,單芯片F(xiàn)PGA提供了更穩(wěn)定的系統(tǒng)性能、更低的成本以及最佳的性價(jià)比。[nextpage]
2、用FPGA實(shí)現(xiàn)DSP實(shí)時(shí)視頻處理功能
與ASSP和芯片組解決方案相比,F(xiàn)PGA可根據(jù)設(shè)計(jì)工程師的實(shí)際需求提供不同層次的靈活性,并保持明顯優(yōu)于傳統(tǒng)DSP的性能。實(shí)時(shí)視頻處理對系統(tǒng)性能的要求極高,因此幾乎所有只具最簡單功能的通用DSP都不具備這項(xiàng)功能。而可編程邏輯器件允許設(shè)計(jì)人員利用并行處理技術(shù)實(shí)現(xiàn)視頻信號處理算法,并且只需單個(gè)器件就能實(shí)現(xiàn)所期望的性能?;贒SP的解決方案通常需要在單板上嵌入許多DSP,以得到必需的處理能力,這無疑將增加程序資源和數(shù)據(jù)存儲器資源開銷。由于在極窄的傳輸信道(如無線信道)上發(fā)送高帶寬視頻數(shù)據(jù)并保持適當(dāng)?shù)臉I(yè)務(wù)質(zhì)量(QoS)極其困難,因此設(shè)計(jì)人員建立在FPGA實(shí)現(xiàn)的基礎(chǔ)上致力于改進(jìn)糾錯(cuò)、壓縮和圖像處理技術(shù)。MPEG-4算法的核心是一種稱為離散余弦變換(DCT)的操作,其DCT部分已經(jīng)標(biāo)準(zhǔn)化并能在FPGA中有效實(shí)現(xiàn),許多專用MPEG解碼器在這些部分(如運(yùn)動估計(jì)模塊)也使用了FPGA。因?yàn)镕PGA可重新配置,因此器件能方便地進(jìn)行刷新,并在整個(gè)開發(fā)階段(包括配置之后)集成新算法。
視頻系統(tǒng)另一重要部分是色彩空間轉(zhuǎn)換,采用FPGA的系統(tǒng)架構(gòu)就能調(diào)整應(yīng)用系統(tǒng)的算法,由此實(shí)現(xiàn)最佳的性能和效率。FPGA可以通過定制調(diào)整提供最具實(shí)用價(jià)值的高性能高效率產(chǎn)品,設(shè)計(jì)人員可在適用范圍和速率之間進(jìn)行折衷考慮,從而以比DSP時(shí)鐘低得多的速率實(shí)現(xiàn)指定功能。如在中值濾波器應(yīng)用中,DSP處理器需要67個(gè)時(shí)鐘周期執(zhí)行算法,而FPGA只需工作在25MHz頻率下,因?yàn)镕PGA能并行實(shí)現(xiàn)該功能。但實(shí)現(xiàn)上述功能的DSP必須工作在1.5GHz頻率下,可見在此特定應(yīng)用中,F(xiàn)PGA解決方案的處理能力可以達(dá)到100MHz DSP處理器的17倍。
許多實(shí)時(shí)圖像和視頻處理功能均適合于用FPGA器件來實(shí)現(xiàn),包括有:圖像旋轉(zhuǎn)、圖像縮放色彩校正和色度校正、陰影增強(qiáng)、邊緣檢測、直方圖功能、銳化、中值濾波器和斑點(diǎn)分析等。許多功能都針對特定的應(yīng)用和系統(tǒng),并構(gòu)建在核心架構(gòu)(如2D-FIR濾波器)之上。我們可以利用HDL設(shè)計(jì)語言或高級內(nèi)核設(shè)計(jì)工具(如Xilinx CoreGen軟件)中的DSP程序塊迅速實(shí)現(xiàn)這些功能。此外,還能通過系統(tǒng)級設(shè)計(jì)方法,利用Matlabs Simulink和Xilinx System Generator工具進(jìn)一步減少設(shè)計(jì)和仿真時(shí)間。
3、利用FPGA構(gòu)建嵌入式系統(tǒng)的圖像和視頻控制器
采用FPGA器件構(gòu)建視頻和圖像控制器,正在使圖像顯示技術(shù)進(jìn)入越來越多的嵌入式應(yīng)用。由于在性能和靈活性方面的完美組合,F(xiàn)PGA在DSP領(lǐng)域的應(yīng)用越來越普遍。
Actel公司宣布推出全新的低功耗現(xiàn)場可編程門陣列(FPGA)系列IGLOO PLUS,進(jìn)一步擴(kuò)展其面向具有功耗意識設(shè)計(jì)的廣泛的低功耗可編程解決方案資源。全新的FPGA器件提供可編程邏輯器件中每I/O最佳的功耗、面積、邏輯和功能比率。IGLOO PLUS系列的靜態(tài)功耗僅5μW,并經(jīng)過I/O優(yōu)化,比較Actel屢獲殊榮的IGLOO系列提供多出64%的I/O,并支持獨(dú)立的施密特觸發(fā)器輸入、熱插拔和Flash Freeze總線保持。由于IGLOO PLUS系列器件具有低功耗和經(jīng)I/O優(yōu)化,這使其成為消費(fèi)電子、工業(yè)、通信、醫(yī)療和測試應(yīng)用領(lǐng)域中便攜式電子設(shè)備的理想選擇,尤其是那些需要I/O密集內(nèi)存總線操作、通用I/O擴(kuò)展、排序、接口轉(zhuǎn)換、存儲,以及人機(jī)界面觸摸屏和鍵盤技術(shù)的應(yīng)用。[nextpage]
DSP+FPGA實(shí)時(shí)信號處理系統(tǒng)
實(shí)時(shí)信號處理系統(tǒng)要求必須具有處理大數(shù)據(jù)量的能力,以保證系統(tǒng)的實(shí)時(shí)性;其次對系統(tǒng)的體積、功耗、穩(wěn)定性等也有較嚴(yán)格的要求。因此,實(shí)時(shí)信號處理系統(tǒng)是對運(yùn)算速度要求高、運(yùn)算種類多的綜合性信息處理系統(tǒng)。
DSP+FPGA結(jié)構(gòu)最大的特點(diǎn)是結(jié)構(gòu)靈活,有較強(qiáng)的通用性,適于模塊化設(shè)計(jì),從而能夠提高算法效率;同時(shí)其開發(fā)周期較短,系統(tǒng)易于維護(hù)和擴(kuò)展,適合于實(shí)時(shí)信號處理。在實(shí)時(shí)信號處理系統(tǒng)中,低層的信號預(yù)處理算法處理的數(shù)據(jù)量大,對處理速度的要求高,但運(yùn)算結(jié)構(gòu)相對比較簡單,適于用FPGA進(jìn)行硬件實(shí)現(xiàn),這樣能同時(shí)兼顧速度及靈活性。高層處理算法的特點(diǎn)是所處理的數(shù)據(jù)量較低層算法少,但算法的控制結(jié)構(gòu)復(fù)雜,適于用運(yùn)算速度高、尋址方式靈活、通信機(jī)制強(qiáng)大的DSP芯片來實(shí)現(xiàn)。
例如,應(yīng)用線性流水陣列結(jié)構(gòu)可實(shí)現(xiàn)一個(gè)實(shí)時(shí)目標(biāo)檢測系統(tǒng),該系統(tǒng)的任務(wù)主要是接收攝像頭輸出的灰度圖像,經(jīng)預(yù)處理、編碼、直線擬合和目標(biāo)識別后,輸出結(jié)果到PC機(jī)顯示。在這個(gè)任務(wù)中,預(yù)處理模塊包括抽樣、卷積和編碼等步驟,屬于低層的處理,其運(yùn)算數(shù)據(jù)量大,但運(yùn)算結(jié)構(gòu)較規(guī)則,適于用FPGA進(jìn)行純硬件實(shí)現(xiàn);而直線擬合及目標(biāo)識別等高層圖像處理算法,所處理的數(shù)據(jù)量相對較少,但要用到多種數(shù)據(jù)結(jié)構(gòu),其控制也復(fù)雜得多,可用DSP編程來實(shí)現(xiàn)。FPGA選用的是Xilinx公司的XC5200系列FPGA芯片;DSP選用美國TI公司的為滿足并行處理需求的32位浮點(diǎn)的TMS320 C40芯片。
衡量系統(tǒng)的整體性能不僅要看所使用的器件和所能完成的功能,還要看器件之間采用怎樣的互連結(jié)構(gòu)。XC5200可以完成模塊級的任務(wù),起到DSP的協(xié)處理器的作用。它的可編程性使它既具有專用集成電路的速度,又具有很高的靈活性。C40內(nèi)部結(jié)構(gòu)的主要優(yōu)勢是:所有指令的執(zhí)行時(shí)間都是單周期,指令采用流水線,內(nèi)部的數(shù)據(jù)、地址、指令及DMA總線分開,有較多的寄存器。這些特征使它有較高的處理速度。FPGA具有硬件的高速性,而C40具有軟件的靈活性,從器件上考察,能夠滿足處理復(fù)雜算法的要求。同時(shí),C40的6個(gè)通信口和6個(gè)DMA通道使其能夠在不被中斷的情況下比較從容地應(yīng)付與外界大量的數(shù)據(jù)交換。
從PU內(nèi)部互連來看,C40使用了專用的通信口完成與FPGA的互連,能夠保證在任何情況下FPGA與C40的數(shù)據(jù)通道的暢通。另外,F(xiàn)PGA和C40各自都有輸入端口,使得系統(tǒng)的處理結(jié)構(gòu)多樣化。FPGA可以作為處理流程中的一個(gè)模塊,獨(dú)立完成某項(xiàng)功能,也可以作為C40的協(xié)處理器,通過C40的調(diào)用來完成特定的子函數(shù)。底板將互連性延伸到PU之間,使得多個(gè)電路板能夠組成多處理機(jī)系統(tǒng)。前級的C40既可以與下一級的C40通信,也可以將數(shù)據(jù)發(fā)送到下一級的FPGA。
由此可知,選用DSP+FPGA結(jié)構(gòu)的系統(tǒng)具有靈活的處理結(jié)構(gòu),對不同結(jié)構(gòu)的算法都有較強(qiáng)的適應(yīng)能力,尤其適合實(shí)時(shí)信號處理任務(wù)。
結(jié)語
由上可知,F(xiàn)PGA與DSP都是現(xiàn)代能嵌入軟件,尤其是嵌入智能軟件使其固化的最好的芯片,但由于制作芯片的側(cè)重點(diǎn)不一樣而各有優(yōu)劣,有分工也有競爭。因此,在選擇使用時(shí),要根據(jù)不同的性能要求及性能價(jià)格比擇優(yōu)選用。一般,通用DSP用于需要復(fù)雜算法的應(yīng)用領(lǐng)域,如果能夠滿足所需的MAC速度,則DSP在成本上具有優(yōu)勢。FPGA以更高的速度和可以通過一個(gè)芯片上的多級MAC單元來提供更高的帶寬,已成為一些高端信號處理應(yīng)用的技術(shù)選擇。
但現(xiàn)在,有實(shí)時(shí)信號處理任務(wù)的系統(tǒng),大多選用DSP+FPGA相結(jié)合的結(jié)構(gòu)形式。這樣,可展現(xiàn)各自的所長,使DSP+FPGA結(jié)構(gòu)的系統(tǒng)具有靈活的處理結(jié)構(gòu),且對不同結(jié)構(gòu)的算法,能有較強(qiáng)的適應(yīng)能力。所以,DSP+FPGA結(jié)構(gòu)的形式,將是智能安防監(jiān)控系統(tǒng)的最佳形式。