【安防知識網(wǎng)】隨著監(jiān)控系統(tǒng)的普及化及龐大化,傳統(tǒng)人為監(jiān)控的局限性越來越突出。人作為監(jiān)控者有其先天不足,人腦只能關(guān)注一件事物,所謂一心不能二用,當(dāng)監(jiān)控者同時觀測多個監(jiān)視器時,監(jiān)控精度會隨著監(jiān)控視頻數(shù)量的上升而下降。再者,人對于單調(diào)的事物無法長時間的集中注意力,根據(jù)研究人在關(guān)注監(jiān)控圖像20分鐘后,其注意力會下降到無法接受的程度。最后人需要飲食休息等生理活動,這也會影響監(jiān)控系統(tǒng)的可靠性。這就是為什么傳統(tǒng)人為監(jiān)控系統(tǒng)往往存在漏報(bào)率高、響應(yīng)速度慢及可靠性差等問題。另外,監(jiān)控系統(tǒng)越來越龐大,如果全部采用人為監(jiān)控,其人力成本也會非常昂貴。
智能視頻監(jiān)控技術(shù)(intelligent video surveillance)起源于計(jì)算機(jī)視覺技術(shù)(computer vision),它對視頻進(jìn)行分析,從視頻中提取信息,發(fā)現(xiàn)感興趣事件,從而可以在某些場合替代人為監(jiān)控或者協(xié)助人為監(jiān)控。在911事件以后,國際上出于反恐斗爭的嚴(yán)峻形勢,對于智能視頻監(jiān)控技術(shù)的需求越來越迫切,CPU處理能力的快速提升,也使得許多復(fù)雜視頻算法的實(shí)現(xiàn)成為可能,這些因素不斷地推動著智能視頻監(jiān)控技術(shù)及其市場的發(fā)展。
智能視頻監(jiān)控技術(shù)的優(yōu)勢就在于它可以一天24小時不間斷地對視頻進(jìn)行監(jiān)控,一旦有事件發(fā)生可以及時報(bào)警,相對于人為監(jiān)控來說,智能化監(jiān)控可靠性更高,成本更加低廉。智能視頻監(jiān)控技術(shù)的市場需求正在不斷上升,其產(chǎn)品形態(tài)也在不斷豐富。
智能視頻監(jiān)控技術(shù)產(chǎn)品化及市場化的過程中,出現(xiàn)了許多智能視頻監(jiān)控產(chǎn)品,應(yīng)用這些產(chǎn)品成功實(shí)現(xiàn)了許多的應(yīng)用案例,但是也有一些客戶表示智能視頻監(jiān)控產(chǎn)品沒有很好地滿足他們的需要,或者存在誤報(bào)率或漏報(bào)率過高的問題。
現(xiàn)在的智能視頻監(jiān)控技術(shù),已經(jīng)從前幾年的演示階段逐漸進(jìn)入規(guī)?;褂秒A段。在這個階段,如何應(yīng)用現(xiàn)有的智能視頻監(jiān)控技術(shù)切實(shí)地解決客戶的問題,為客戶創(chuàng)造價(jià)值,是智能視頻監(jiān)控產(chǎn)品供應(yīng)商所需要考慮并解決的重大問題。
但要解決這一問題,必須立足于對智能視頻監(jiān)控技術(shù)核心的深入理解。只有具備了這樣的基礎(chǔ),才能了解現(xiàn)階段的智能視頻監(jiān)控技術(shù)能夠做什么,不能夠做什么,影響其性能的因素有哪些,要實(shí)現(xiàn)一些特定功能需要做什么。
技術(shù)背景
智能視頻監(jiān)控技術(shù)主要是指對固定的監(jiān)控?cái)z像機(jī)拍攝的視頻進(jìn)行分析,獲得視頻中的運(yùn)動目標(biāo)信息,提取語義級別的事件信息,從而做出反應(yīng)的一種技術(shù)(也有針對移動攝像機(jī)視頻進(jìn)行分析的技術(shù),但不是智能視頻監(jiān)控產(chǎn)品的主流)。
智能視頻監(jiān)控技術(shù)的主要框架分為前景檢測、目標(biāo)檢測、目標(biāo)跟蹤、目標(biāo)分類、軌跡分析、事件檢測等幾個部分。
首先利用前景檢測技術(shù)將視頻圖像中的前景團(tuán)塊(blob)從圖像背景中分離出來,前景團(tuán)塊是指視頻圖像中變化劇烈的圖像區(qū)域。前景檢測技術(shù)有多種實(shí)現(xiàn)方法,包括幀差法、多高斯背景建模及非參數(shù)背景建模等等方法,各種方法的復(fù)雜程度不同,對于各種場景的適應(yīng)能力也有很大差異。
目標(biāo)檢測技術(shù)分析前景團(tuán)塊在視頻序列中的狀態(tài),將具有穩(wěn)定存在狀態(tài)及運(yùn)動規(guī)律的前景團(tuán)塊作為運(yùn)動目標(biāo)提取出來。
目標(biāo)跟蹤技術(shù)利用運(yùn)動目標(biāo)的歷史信息預(yù)測運(yùn)動目標(biāo)在本幀可能出現(xiàn)的位置,并在預(yù)測位置附近搜索該運(yùn)動目標(biāo)。目標(biāo)跟蹤技術(shù)也有多種實(shí)現(xiàn)方法,包括連接區(qū)域跟蹤、模板匹配、粒子濾波等等,這些方法在不同場景下的表現(xiàn)也有較大的差異性。
目標(biāo)分類技術(shù)對跟蹤成功的目標(biāo)進(jìn)行分類,一般將目標(biāo)分為人和車輛兩類,也有一些特殊應(yīng)用會對目標(biāo)進(jìn)行其它類型的分辨。目標(biāo)分類技術(shù)利用一些圖像特征值實(shí)現(xiàn)目標(biāo)類型的甄別,許多種特征可供采用,例如目標(biāo)輪廓、目標(biāo)尺寸、目標(biāo)紋理等等。一系列訓(xùn)練樣本(各種視頻圖像)會被用于訓(xùn)練分類算法,分類算法根據(jù)特征對監(jiān)控視頻中的目標(biāo)進(jìn)行類型甄別。分類算法也有多種實(shí)現(xiàn)方法,包括支撐向量機(jī)、Adaboost,神經(jīng)網(wǎng)絡(luò)等等。分類特征的選取,分類方法的實(shí)現(xiàn)及訓(xùn)練樣本等,都會使分類技術(shù)產(chǎn)生較大的差異性。
軌跡分析技術(shù)對跟蹤成功的目標(biāo)的運(yùn)動軌跡進(jìn)行分析,對運(yùn)動軌跡進(jìn)行平滑及誤差修正,使目標(biāo)的運(yùn)動軌跡更加接近于真實(shí)狀態(tài)。
事件檢測技術(shù)則將目標(biāo)信息與用戶設(shè)定的報(bào)警規(guī)則進(jìn)行邏輯判斷,判斷是否有目標(biāo)觸發(fā)了報(bào)警規(guī)則,并做出報(bào)警響應(yīng)。
圖1是智能視頻監(jiān)控技術(shù)常用的算法框架,有時為了提高智能視頻監(jiān)控技術(shù)在某些場景下的性能,一些附加模塊也會被加入算法框架。例如抗抖動模塊可以提升該技術(shù)在攝像機(jī)抖動情況下的處理效果;陰影抑制模塊可以提升該技術(shù)在陰影嚴(yán)重的室外場景下的處理效果;車燈抑制模塊可以提升該技術(shù)在光照劇烈變化場景下的處理效果;碰撞處理模塊可以提升該技術(shù)在目標(biāo)圖像頻繁互相遮擋場景下的跟蹤精度。
[nextpage]在智能視頻監(jiān)控技術(shù)的常用框架下大多數(shù)模塊有多種實(shí)現(xiàn)方案,僅前景檢測一項(xiàng)就有多達(dá)七、八種選擇(或者更多),這些實(shí)現(xiàn)方案之間的復(fù)雜度差異很大,它們的穩(wěn)定性及性能差異也非常明顯。如果在上述框架下采用簡單易用的方案來實(shí)現(xiàn)各個模塊,搭建一套智能視頻監(jiān)控技術(shù)并不是非常困難,但是其性能及其對各種場景的適應(yīng)能力就很難得到保證。這就是為什么各種智能視頻監(jiān)控產(chǎn)品提供的功能大同小異,而存在很大性能差異的原因。舉例來說,簡單的幀差法就可以實(shí)現(xiàn)前景檢測,在穩(wěn)定簡單的場景下該方法也可以得到較好的前景檢測結(jié)果,但是在視頻發(fā)生擾動或者光照變化時,大量的靜態(tài)圖像區(qū)域就會被當(dāng)作前景誤檢出來。
一套性能優(yōu)越的智能視頻監(jiān)控技術(shù)在算法設(shè)計(jì)過程就需要考慮監(jiān)控場景中可能出現(xiàn)的各種復(fù)雜情況,內(nèi)部的各個算法模塊必須要具有對復(fù)雜場景的適應(yīng)性,并且加入各種附加模塊提升智能視頻監(jiān)控技術(shù)對特殊場景的處理效果。
性能分析
一套性能優(yōu)越的智能視頻監(jiān)控技術(shù)是否可以不受場景的影響,在各種場景下都達(dá)到最佳處理效果呢?答案是否定的。
這首先是由計(jì)算機(jī)視覺技術(shù)的發(fā)展水平?jīng)Q定的,因?yàn)橛?jì)算機(jī)視覺技術(shù)還處于發(fā)展階段,與人腦相比,計(jì)算機(jī)的智能程度還遜色很多。它用一些數(shù)學(xué)模型來描述真實(shí)世界,并試圖用這些數(shù)學(xué)模型來分析視頻數(shù)據(jù)并從中獲取視頻信息內(nèi)容,但是最復(fù)雜的數(shù)學(xué)模型現(xiàn)階段也無法囊括真實(shí)世界中的所有特性(就算有這樣的模型,普通CPU也支撐不了這樣龐大的計(jì)算)。不同的監(jiān)控場景與智能視頻監(jiān)控技術(shù)內(nèi)部數(shù)學(xué)模型之間的吻合程度會有所不同,因此智能視頻監(jiān)控技術(shù)的精度或多或少會受監(jiān)控場景的影響。
其次,監(jiān)控場景的復(fù)雜程度也會對處理結(jié)果產(chǎn)生重要影響,因?yàn)閺?fù)雜的場景往往意味著有效信息提取的困難。在傳統(tǒng)人為監(jiān)控系統(tǒng)中,監(jiān)控者對于低照度、高擾動、高擁擠程度視頻的監(jiān)測精度一般會較低。同樣,智能視頻監(jiān)控技術(shù)的精度也會受監(jiān)控場景復(fù)雜程度的影響。
怎樣才能利用智能視頻監(jiān)控技術(shù)獲得令人滿意的智能監(jiān)控效果呢?首先要基于對智能視頻監(jiān)控技術(shù)內(nèi)部算法的理解,調(diào)整監(jiān)控環(huán)境或者調(diào)試算法使監(jiān)控環(huán)境與智能視頻監(jiān)控技術(shù)內(nèi)部的算法模型達(dá)到最大的一致性。舉例來說,如果智能視頻監(jiān)控技術(shù)的目標(biāo)分類模塊將目標(biāo)尺寸作為重要的分類特征,在大景深的場景中,目標(biāo)尺寸變化幅度很大,該目標(biāo)分類模塊的精度就會大大降低。有多種方法可以解決這一問題,降低場景的景深,加入場景標(biāo)定算法,降低尺寸特征在分類算法中的權(quán)重。
要在條件允許的情況下盡量降低監(jiān)控場景的復(fù)雜度,凸出有效信息。攝像機(jī)的選用及安裝非常重要,要選用性能較好的攝像機(jī),提升圖像的信噪比,如果對夜晚場景進(jìn)行監(jiān)控,則最好選用紅外攝像機(jī)。安裝攝像機(jī)時,要合理選擇安裝位置及攝像機(jī)角度,盡量使視頻圖像擾動較少且目標(biāo)重疊較少。舉例來說,要在較擁擠的場景中統(tǒng)計(jì)人流量,俯視角度是一個理想攝像機(jī)安裝角度,因?yàn)樵谠摻嵌认拢繕?biāo)的重疊程度較小(如果智能視頻監(jiān)控技術(shù)中使用了人臉檢測算法來進(jìn)行人流量統(tǒng)計(jì),情況會有所不同)。除了攝像機(jī)的選用及安裝外,合理設(shè)置警戒規(guī)則也會提升智能視頻監(jiān)控技術(shù)的處理效果。舉例來說,在下圖場景中統(tǒng)計(jì)車流量,左圖的警戒規(guī)則就不太理想,因?yàn)樵诰湟?guī)則的設(shè)置區(qū)域有樹木等物體遮擋目標(biāo),智能視頻監(jiān)控技術(shù)在該區(qū)域容易產(chǎn)生目標(biāo)的誤檢及誤跟蹤;右圖的報(bào)警規(guī)則就避開了遮擋區(qū)域,其處理效果就比較理想。(如圖2所示)