18523875858
重慶川博科技
聯(lián)系人:張經(jīng)理
手機:18523875858
座機:023-86176456
Q Q:1186253602 499692687
地址:重慶市九龍坡區(qū)太平洋安防市場4B18-19
網(wǎng)址:www.zuqiubaobao.com
智能監(jiān)控領(lǐng)域研究的主要內(nèi)容和難題分析
研究內(nèi)容
智能監(jiān)控系統(tǒng)——手機視頻監(jiān)控報警系統(tǒng)是安防進入民用化領(lǐng)域的一套智能系統(tǒng),該系統(tǒng)集成了手機監(jiān)控與手機防盜報警兩大系統(tǒng) ,當有非法人員闖入禁區(qū)防區(qū)或者火災(zāi)煤氣泄漏等緊急情況時,系統(tǒng)主機會第一時間給指定用戶撥打電話及發(fā)送短信或email!用戶收到電話短信時可以第一時間用手機或者電腦查看監(jiān)控區(qū)域的畫面。消除了傳統(tǒng)監(jiān)控系統(tǒng)馬后炮及傳統(tǒng)報警系統(tǒng)誤報出警的顧慮!該系統(tǒng)集成了無線門磁、無線煙感等無線報警配件信息,有效的提高了監(jiān)控系統(tǒng)民用化的特性。深圳市凱特科技有限公司是專業(yè)從事手機視頻監(jiān)控產(chǎn)品,該產(chǎn)品的配套手機軟件即凱特守護神能與視頻監(jiān)控及家庭報警聯(lián)動至手機短信或電話中。該產(chǎn)品也是一款智能家居安防監(jiān)控防盜系統(tǒng):該系統(tǒng)系網(wǎng)絡(luò)但無需電腦即可獨立完成!本地存儲器24小時錄像,異地可通過上網(wǎng)手機或電腦可觀看及操作家中所有監(jiān)控畫面。系統(tǒng)自帶無線報警模塊,可匹配無線門磁、探頭、煙感器等無線報警觸發(fā)設(shè)備,當有人闖入監(jiān)控防區(qū),系統(tǒng)會自動打電話、發(fā)短信、郵件給指定的4位手機用戶,同時本地會產(chǎn)生聲光警笛。遠程用戶收到警情電話、信息后可以通過上網(wǎng)手機或電腦查看監(jiān)控畫面情況,并通過手機控制攝像機旋轉(zhuǎn)角度及焦距、報警系統(tǒng)布防撤防,同時啟動手機錄像功能并處理警情。
環(huán)境建模
要進行場景的視覺監(jiān)控,環(huán)境模型的動態(tài)創(chuàng)建和更新是必不可少的。在攝像機靜止的條件下,環(huán)境建模的工作是從一個動態(tài)圖像序列中獲取并自動更新背景模型。其中 為關(guān)鍵的問題在于怎樣消除場景中的各種干擾因素,如光照變化、陰影、搖動的窗簾、閃爍的屏幕、緩慢移動的人體以及新加入的或被移走的物體等的影響。
運動檢測
運動檢測的目的是從序列圖像中將變化區(qū)域從背景圖像中提取出來。運動區(qū)域的有效分割對于目標分類、跟蹤和行為理解等后期處理是非常重要的,因為以后的處理過程僅僅考慮圖像中對應(yīng)于運動區(qū)域的像素。然而,由于背景圖像的動態(tài)變化,如天氣、光照、影子及混亂干擾等的影響,使得運動檢測成為一項相當困難的工作。
目標分類
對于人體監(jiān)控系統(tǒng)而言,在得到了運動區(qū)域的信息之后,下面一個重要的問題就是如何將人體目標從所有運動目標中分類出來。不同的運動區(qū)域可能對應(yīng)于不同的運動目標,比如一個室外監(jiān)控攝像機所捕捉的序列圖像中除了有人以外,還可能包含寵物、車輛、飛鳥、搖動的植物等運動物體。為了便于進一步對行人進行跟蹤和行為分析,運動目標的正確分類是完全必要的。但是,在已經(jīng)知道場景中僅僅存在人的運動時(比如在室內(nèi)環(huán)境下),這個步驟就不是必需的了。
人體跟蹤
人體的跟蹤可以有兩種含義,一種是在二維圖像坐標系下的跟蹤,一種是在三維空間坐標系下的跟蹤。前者是指在二維圖像中,建立運動區(qū)域和運動人體(或人體的某部分)的對應(yīng)關(guān)系,并在一個連續(xù)的圖像序列中維持這個對應(yīng)關(guān)系。從運動檢測得到的一般是人的投影,要進行跟蹤首先要給需要跟蹤的對象建立一個模型。對象模型可以是整個人體,這時形狀、顏色、位置、速度、步態(tài)等等都是可以利用的信息;也可以是人體的一部分如上臂、頭部或手掌等,這時需要對這些部分單獨進行建模。建模之后,將運動檢測到的投影匹配到這個模型上去。一旦匹配工作完成,我們就得到了 終有用的人體信息,跟蹤過程也就完成了。
數(shù)據(jù)融合
采用多個攝像機可以增加視頻監(jiān)控系統(tǒng)的視野和功能。由于不同類型攝像機的功能和適用場合不一樣,常常需要把多種攝像機的數(shù)據(jù)融合在一起。在需要恢復三維信息和立體視覺的場合,也需要將多個攝像機的圖像進行綜合處理。此外,多個攝像機也有利于解決遮擋問題。
行為理解
事件檢測、行為的理解和描述屬于智能監(jiān)控高層次的內(nèi)容。它主要是對人的運動模式進行分析和識別,并用自然語言等加以描述。相比而言,以前大多數(shù)的研究都集中在運動檢測和人的跟蹤等底層視覺問題上,這方面的研究較少。近年來關(guān)于這方面的研究越來越多,逐漸成為熱點之一。
研究現(xiàn)狀
智能監(jiān)控具有廣泛的應(yīng)用前景和潛在的經(jīng)濟價值,從而激發(fā)了世界上廣大科研工作者及相關(guān)人士的濃厚興趣,尤其在美國、英國等國家已經(jīng)開展了大量相關(guān)項目的研究。例如,1997年美國國防高級研究項目署(DefenseAdvancedResearchProjeCtSAgency)設(shè)立了視覺監(jiān)控重大項目VSAM主要研究用于戰(zhàn)場及普通民用場景進行監(jiān)控的自動視頻理解技術(shù)。實時視覺監(jiān)控系統(tǒng)不僅能夠定位人和分割出人的身體部分,而且通過建立外觀模型來實現(xiàn)多人的跟蹤,并可以檢測人是否攜帶物體等簡單行為。英國的雷丁大學(UniversityofReading)己開展了對車輛和行人的跟蹤及其交互作用識別的相關(guān)研究;國際上很多權(quán)威期刊將智能監(jiān)控中人的運動分析研究作為主題內(nèi)容之一,為該領(lǐng)域的研究人員提供了更多的交流機會。
在我國,這方面的研究近幾年才開展起來的。中國科學院自動化研究所模式識別國家重點實驗室己經(jīng)成立智能視覺監(jiān)控研究組,開展這方面的研究,目標是實現(xiàn)一個動態(tài)場景集成分析演示系統(tǒng)并 終推向?qū)嵱?。第一屆全國智能視覺監(jiān)控學術(shù)會議于2002年5月25一26日在北京市西郊賓館成功舉行。國內(nèi)有一些視頻監(jiān)控方面的產(chǎn)品,如Anychat、黃金眼、行者貓王等,應(yīng)用于交通控制,監(jiān)獄管理等方面。另外,國內(nèi)產(chǎn)品還有數(shù)字硬盤錄像系統(tǒng)(DVR),將監(jiān)控區(qū)域內(nèi)有運動對象出現(xiàn)的情況錄制下來,以備查詢,該系統(tǒng)只是簡單的檢測出有無運動對象,而沒有對運動對象做任何分析。
由于國內(nèi)的研究起步較晚,技術(shù)還不夠完善,開發(fā)出的產(chǎn)品距離智能化還有一定差距,在實際的應(yīng)用中,受到很多限制,還有待于進一步的完善。
研究難點
盡管在智能監(jiān)控領(lǐng)域已經(jīng)取得了一定的進展,但是在以下幾個方面仍是今后研究的難點問題。
運動分割
快速準確的運動分割是個相當重要又是比較困難的一個問題。這是由于動態(tài)環(huán)境中捕捉的圖像受到多方面的影像,比如天氣的變化,光照條件的變化,背景的混亂干擾,運動目標的影子,物體之間或者物體與環(huán)境之間的遮擋,以及攝像機的運動等。這些都給準確有效的運動分割帶來了困難,以運動目標的影子為例,他可能與被檢測目標的相連,也可能與目標分離,在前者情況下,影子扭曲了目標的形狀,從而使得以后基于形狀和基于狀態(tài)空間模型的方法定義每個靜態(tài)姿勢作為一個狀態(tài),這些狀態(tài)之間通過的識別方法不再可靠;在后者情況下,影子有可能被誤認為為場景中一個完全錯誤的目標。盡管目前圖像運動分割主要利用背景減除方法,但如何建立對于任何具有自適應(yīng)性的復雜環(huán)境中動態(tài)變化的背景模型仍是相當困難的問題。一個可喜的發(fā)展是,一些研究者們正利用時空統(tǒng)計的方法構(gòu)建自適應(yīng)的背景模型,這對于不受限環(huán)境中的運動分割而言是個更好的選擇。
遮擋處理
目前,大部分智能監(jiān)控系統(tǒng)都不能很好地解決目標之間互遮擋和人體自遮擋問題,尤其是在擁擠狀態(tài)下,多人的檢測和跟蹤問題更是難處理。遮擋時,人體只有部分是可見的,而且這個過程一般是隨機的,簡單依賴于背景減除進行運動分割的技術(shù)此時將不再可靠,為了減少遮擋或深度所帶來的歧義性問題,必須開發(fā)更好的模型來處理遮擋時特征與身體各部分之間的準確對應(yīng)問題。另外,一般系統(tǒng)也不能完成何時停止和重新開始身體部分的跟蹤,即遮擋前后的跟蹤初始化缺少自舉方法。當然,可喜的進步是利用統(tǒng)計方法從可獲得的圖像信息中進行人體姿勢、位置等的預(yù)測;不過,對于解決遮擋問題 有實際意義的潛在方法應(yīng)該是基于多攝像機的跟蹤系統(tǒng)。
建模與跟蹤
二維方法在早期智能監(jiān)控系統(tǒng)中證明是很成功的,尤其對于那些不需要精確的姿勢恢復或低圖像分辨率的應(yīng)用場合(如交通監(jiān)控中的行人跟蹤)。二維跟蹤有著簡單快速的優(yōu)點,主要的缺點是受攝像機角度的限制。而三維方法在不受限的復雜的人的運動判斷(如人的徘徊、握手與跳舞等)、更加準確的物理空間的表達、遮擋的準確預(yù)測和處理等方面的優(yōu)點是用于行為識別;同時,三維恢復對于虛擬現(xiàn)實中的應(yīng)用也是必需的。目前基于視覺的三維跟蹤研究仍相當有限,三維姿勢恢復的實例亦很少,且大部分系統(tǒng)由于要求魯棒性而引入了簡化的約束條件。三維跟蹤也導致了從圖像中人體模型的獲取、遮擋處理、人體參數(shù)化建模、攝像機的標定等一系列難題。以建模為例,人體模型通常使用許多形狀參數(shù)所表達。然而,目前的模型很少利用了關(guān)節(jié)的角度約束和人體部分的動態(tài)特性;而且過去的一些工作幾乎都假設(shè)3 D模型依據(jù)先驗條件而提前被指定,實際上這些形狀參數(shù)應(yīng)當從圖像中估計出來。總之,3 D建模與跟蹤在未來工作中應(yīng)值得更多的關(guān)注。
攝像機的使用
使用單一攝像機的三維人的跟蹤研究還很缺乏,身體姿勢和運動在單一視角下由于遮擋或深度影響而容易產(chǎn)生歧義現(xiàn)象,因此使用多攝像機進行三維姿勢跟蹤和恢復的優(yōu)點是很明顯的。同時,多攝像機的使用不僅可以擴大監(jiān)視的有效范圍,而且可以提供多個不同的方向視角以用于解決遮擋問題。很明顯,未來的智能監(jiān)控系統(tǒng)將極大受益于多攝像機的使用。對于多攝像機跟蹤系統(tǒng)而言,我們需要確定在每個時刻使用哪一個攝像機或哪一幅圖像。也就是說,多攝像機之間的選擇和信息融合是一個比較重要的問題。
性能評估
一般而言,魯棒性、準確度、速度是智能監(jiān)控系統(tǒng)的三個基本要求。例如,系統(tǒng)的魯棒性對于監(jiān)控應(yīng)用特別重要,這是因為它們通常被要求是自動、連續(xù)地工作,因此這些系統(tǒng)對于如噪聲、光照、天氣等因素的影響不能太敏感;系統(tǒng)的準確度對于控制應(yīng)用特別重要,例如基于行為或姿勢識別的接口控制場合;而系統(tǒng)的處理速度對于那些需要實時高速的監(jiān)控系統(tǒng)而言更是非常關(guān)鍵。因此,如何選擇有效的工作方案來提高系統(tǒng)性能、降低計算代價是個特別值得考慮的問題。同時,如何利用來自不同用戶、不同環(huán)境、不同實驗條件的大量數(shù)據(jù)測試系統(tǒng)的實時性、魯棒性亦相當重要。