目標導向前景物件影像抽取技術...
黃雅軒教授
中華大學
在前瞻性視訊監控技術中,前景物件和背景影像分離是一項非常重要的處理步驟。一般而言,背景物體的直覺特徵應該是「一段時間固定不動的物體」,也就是非移動的物體;前景則是「移動或短暫出現的物體」。但在現實環境中,很多物體應該是屬於背景的一部分,但是卻是在移動的;而一個會動的物體(如人和車),如果在視訊畫面中一段時間都未移動,應該將該物體視為背景的一部分。另外,在安全監控和消費娛樂上的應用中,通常是只針對特定的物件才需進行分析和處理。例如,「人」和「車」是安全上最主要的考慮對象。基於這樣的了解,我們提出一種具目標物件導向之前景物體的新定義,那就是「移動或短暫出現且有明顯分析意義的物體」。如此一來,背景的定義就變成相當清楚而容易了解,即滿足「移動或短暫出現且具有明顯分析意義目的」的物體影像就是背景影像。在這樣的定義下,我們會先找到存在具有明顯分析意義的物件區域,再去針對此區域執行前景/背景物件分離處理。由於偵測區域影像中是否存在物件的運算較複雜,故不應該對影像中所有的區域來執行此運算。為了效率考量,將只針對與背景模型具有顯著差異的區域來執行物件偵測的運算。因此,這種目標導向的前景物件抽取大致包含有「畫面式前景/背景影像分離」,「區域掃描」,「物件偵測」,「區域式前景/背景影像分離」,和「背景模型更新」等重要的處理模組。它們的功能分別為
.gif)
1.畫面式前景/背景影像分離模組的目的是用來指出在整張影像中有那些部分是屬於較明顯的前景影像,它可採用任何一種常用的前景影像偵測演算法(如GMM[32])來實現。由於本模組需要對整張畫面中所有的影像點進行判斷,也能會搭配著以區塊(Block)為基礎的前景/背景判斷方式來加快處理速度。
2.區域掃描模組則是用一個固定大小的矩形視窗(Window)以由左至右由上到下的方式來逐一掃描整張影像,當一區域影像中並沒有夠量的前景影像時,則此區域影像會被認為並不存在有前景物件。當某一區域影像中擁有足夠的前景影像訊號時,則代表此區域影像有可能存在某種前景物件,因而需要將此區域的影像進一步的用物件偵測模組來判斷是否有真正有物件的存在。
3. 物件偵測模組使用Adaboosting演算法來判斷某一區域影像是否存在著某種特定物件
4. 當某一區域影像擁有夠量的前影像訊號以及此區域影像又被判別存在著某種特殊物件時,區域式前景/背景影像分離模組才會被執行來獲得此區域的前景/背景影像。由於這個模組的處理範圍是限定在一個固定大小的區域,此區域範圍內每一點的差異臨界值可依對物件的瞭解而有不同的設定,因此在此區域內可得到比畫面式前景/背景影像分離模組更正確的結果
5.由於偵測過程中可以得到許多情況的判斷資訊(如存在著物件的影像區域、前景影像點、背景影像點等),因此背景模型更新能更多樣和有效。
「不見廬山真面目,只緣身在此山中」,由於傳統方法主要是根據單一影像點的特徵資訊(顏色或紋理)來判斷此點是否為前景或者為背景的影像點,這樣的資訊不但太過微觀,而且單一影像點的判斷能力相當有限,使得前景/背景物體分離會面臨許多無法克服的問題。因此,我們的創新作法結合傳統的前景/背景微觀處理與巨觀的物件偵測處理,能具體的提升所抽取的前景物件影像之正確性和完整性。
參考資料
| [1] | C. Stauffer and W. E. L. Grimson, “Learning Patterns of Activity Using Real-Time Tracking”, IEEE Trans. Pattern Analysis and Machine Intelligence, vol. 22, no. 8, pp. 747-757, 2000. |
| [2] | Z. Zivkovic and F. Heijden, “Efficient Adaptive Density Estimation per Image Pixel for the Task of Background Subtraction,” Pattern Recognition Letters, vol. 27, pp 773-780, 2006. |
| [3] | S. C. Cheung and C. Kamath, “Robust Background Subtraction with Foreground Validation for Urban Traffic Video,” EURASIP Journal on Applied Signal Processing, vol.14, pp. 2330-2340, 2005. |
| [4] | C. Anderson, P. Burt, and G. V. D. Wal, “Change Detection and Tracking Using Pyramid Transformation Techniques, “ In Proc. of SPIE Intelligent Robics and Computer Vision, vol. 579, pp. 72-78, 1985. |
| [5] | Y. Freund and R. E. Schapire, “A Decision-Theoretic Generalization of On-Line Learning and an Application to Boosting,” Journal of Computer and System Sciences, vol. 55, pp. 119-139, 1997. |
| [6] | P. Wilson and J. Fernandez, “Facial feature detection using Haar classifiers,” Journal of Computing Sciences in Colleges, 21, pp. 127-133, 2006 |










