文/尹鵬 柳文憑
隨著城市視頻監(jiān)控系統(tǒng)的不斷完善和擴建,視頻已經成為社會數(shù)據量最大的一類數(shù)據,網絡甚至流傳這樣一個段子:電視臺新聞行業(yè)應該給視頻監(jiān)控行業(yè)頒發(fā)“最佳素材獎”,原因是電視臺播放的新聞中,有四分之一的素材來自于視頻監(jiān)控。當然這只是個段子,但無疑也再次驗證了視頻監(jiān)控本身具備的新聞真實性、直觀性等特色,這也是全國公共安全一直大力建設視頻監(jiān)控,把視頻監(jiān)控作為城市基礎建設中一部分的一個原因。
發(fā)揮視頻監(jiān)控在案件研判中的效益
視頻監(jiān)控事實上已經成為公安刑偵研判的第一主要工具,協(xié)助公安系統(tǒng)維護社會的穩(wěn)定,但是并不表示視頻監(jiān)控無懈可擊。我們知道,隨著平安城市的建設速度加快、996文把視頻監(jiān)控定義為城市基礎建設設施的一部分,視頻監(jiān)控錄像的體積將越來越龐大。
據最新的數(shù)據統(tǒng)計表明,視頻監(jiān)控的建設在已經存在2000萬臺的基礎上依然按照每年20%的速度遞增。視頻監(jiān)控錄像已經超過百PB級別,朝EB級別邁進。公安干警通過視頻監(jiān)控偵破一個案件,平均需要調看6000G、3000個小時的錄像。如何讓視頻監(jiān)控在案件研判中越來越重要的作用下更好的發(fā)揮效率是現(xiàn)代視頻監(jiān)控行業(yè)一致認同的行業(yè)性難題。
慶幸的是,現(xiàn)在這個難題已經取得了一定突破性的進展了。在今年7月份由全國安全防范報警系統(tǒng)標準化技術委員會主導的GA/T1164-2014《公安視頻圖像信息聯(lián)網與應用標準體系表》>>也就是行業(yè)內所俗稱的“視圖庫標準最新修訂版”正式發(fā)布。
視圖庫三大業(yè)務核心
視圖庫是什么?視圖庫是一個庫,存下所有的結構化錄像、超感信息;視圖庫是數(shù)據解析中心,能最快速度分析庫里數(shù)據;視圖庫也是合成作戰(zhàn)中心,能整合展現(xiàn)想要的信息。視圖庫是為了解決之前這一系列問題而誕生的,它具備數(shù)據搜集、數(shù)據分析、數(shù)據作戰(zhàn)三個主要業(yè)務核心,利用數(shù)據的合成作戰(zhàn)為案件偵破提供最關鍵線索服務,精確定位線索中的四要素:時間、地點、人物、事件。
數(shù)據搜集
數(shù)據搜集是整個視圖庫的重中之重,它包含了視圖庫最重要的核心-結構化,以及多維數(shù)據采集的超感。
為什么說結構化是重中之重?因為它是從占據EB級存儲量的視頻中提取數(shù)據的唯一方式。能夠對每一個攝像機的監(jiān)控畫面中的車、人信息進行最大化的結構化提取。一段幾百兆的錄像,提取后可以達到只有幾百個字段再加上幾K的圖片壓縮比率。
而做到對每一個監(jiān)控畫面的分析,依賴的是對GPU集群計算的應用。GPU集群是能夠實現(xiàn)1:1結構化的技術支撐。對比CPU,GPU的更多核心和其并行處理架構使GPU成為天然的圖形計算系統(tǒng)。利用GPU做圖形計算,我們可以做到比CPU計算:5倍以上性能提升,價格降低6倍,功耗降低10倍,體積減少20倍。利用依賴于GPU集群計算的1:1實時結構化,我們能夠實現(xiàn)全數(shù)據中秒級響應的以圖搜圖。能夠任意指定搜索車的車牌、車型、車款、顏色、遮陽板狀態(tài)、前擱置物、前玻璃粘貼物。任意指定搜索人的年齡、性別、衣服顏色。
在數(shù)據搜集中另外一個重要的工具是用于多維身份判定的超感,身份識別精度隨數(shù)據量和使用量增加,理論極限可達到萬分之幾的誤差,結構化視頻作為身份判定主參數(shù)毋庸置疑,現(xiàn)在的人臉對比能夠達到99%以上的準確度。而超感的數(shù)據采集作為A類輔助信息其作用也極其重大。
通用的超感工具包分為,被動型和主動型兩種,被動型以wifi sniffer為主,通過采集每個人都隨身攜帶的手機網卡MAC地址,去定位人員。主動型以RFID感知為主,通過對需要管控的人或者物加載有源標簽,可實現(xiàn)精確管控。
其中被動感知的wifi sniffer 功能,可以通過小小大大的反復型線索確認方法提高線索搜索效率。比如我們可以通過幾個攝像機視頻確定一個人員的小范圍視頻軌跡,通過這個視頻軌跡與周邊MAC采集數(shù)據進行軌跡碰撞,碰撞出最可能的幾條MAC軌跡后,可以快速對這幾個MAC軌跡進行大范圍搜索,得到一個更大的MAC軌跡,然后再通過這個輔助MAC軌跡去碰撞視頻監(jiān)控錄像,精準、快速調取錄像內容,最終得到切實的人員視頻軌跡。這就是小小大大的線索確認方式,它提高了監(jiān)控錄像調取效率,降低了公安干警視頻研判的工作量。
RFID作為主動型感知建設功能,其具備切實準確的數(shù)據結果??梢杂米鲇诰_管控,比如電動車進行管控,主要功能包括:提高治安案件主要作案工具的管控,降低猖獗的電動車偷盜相關案件發(fā)生率,規(guī)范電動車超速駕駛,杜絕電動車肇事逃逸。
數(shù)據分析
視圖庫的第二大核心業(yè)務:數(shù)據分析,是公安大數(shù)據建設的重要部分,它的準確度和分析速度直接影響了整個系統(tǒng)的運行效率。
為了提高數(shù)據的準確度,最新的視圖庫技術大范圍使用了人工智能領域的技術桂冠——深度學習算法,它能夠讓機器自動訓練,速度提升十倍。全特征訓練,算法擴展速度提升三倍?,F(xiàn)在的人臉識別精度達到99%以上,依賴的也就是深度學習算法。利用深度學習的宇視人臉識別系統(tǒng),能夠實現(xiàn)人臉識別的超難度工作,無論你做鬼臉、胖了、老了、擋臉、擋嘴、側臉都可以準確的識別出你的存在。
解決了準確度問題,最新的視圖庫技術利用新一代的時空數(shù)據庫去解決速度的問題。時空數(shù)據庫是針對安防特性提出的一個專業(yè)安防數(shù)據庫概念。其開發(fā)依據公安部研究所的研究報告:“只要有4個時間點和位置的數(shù)據,就能確定一個人身份”。依據此研究成果,以時間為線,以地點為軸對結構化信息進行分類的時空數(shù)據庫,能夠更容易、更快速的對視頻內容進行規(guī)則分析,找到線索軌跡。
時空數(shù)據庫中充分整合了兩個最重要的大數(shù)據框架Hadoop和Spark。Hadoop作為模式計算的典范,能夠做到營房中算無遺策,它最大特性是能夠對歷史數(shù)據進行有組織的存儲和計算。屬于戰(zhàn)略層計算,只針對歷史數(shù)據,能夠做到以史觀之,可看歷史規(guī)律、找未來趨勢,獨獨缺乏對現(xiàn)狀的分析,這就依賴另一個大數(shù)據框架,著重進行流式計算的Spark,它做到的是運動中殲敵,屬于戰(zhàn)術層計算,主要特征依賴于內存計算,針對動態(tài)數(shù)據,速度奇快,適合追蹤、布控。
數(shù)據作戰(zhàn)
視圖庫的第三大核心業(yè)務:數(shù)據作戰(zhàn),是視圖庫在用戶面前最直接呈現(xiàn),是數(shù)據展示效果的依托,沒有數(shù)據作戰(zhàn)模塊的展現(xiàn),再多的數(shù)據、再快的分析皆是無用之物。而這些數(shù)據都應該整合在具備時空關系天然展現(xiàn)的電子地圖上,讓數(shù)據一目了然。電子地圖支持直接信息類展現(xiàn),包括設備類:槍機、云臺、球機、超感基站、立桿等基礎設備;警力類:警員、警車、崗亭等警力信息;報警類:110報警、報警崗亭、布控報警等信息;支持數(shù)據分析類地圖展現(xiàn):包括軌跡類,車輛軌跡、RFID軌跡、MAC軌跡;案件分析類,案件軌跡、案件視頻、案件圖片;數(shù)據結果類,案件熱力圖、攝像機密度圖。
(本文作者尹鵬現(xiàn)任職于天津市公安局和平分局、作者柳文憑現(xiàn)任浙江宇視科技有限公司副總工)