時間:2024-01-01 15:43:49
序論:寫作是一種深度的自我表達。它要求我們深入探索自己的思想和情感,挖掘那些隱藏在內(nèi)心深處的真相,好投稿為您帶來了七篇計算機視覺的前景范文,愿它們成為您寫作過程中的靈感催化劑,助力您的創(chuàng)作。
關(guān)鍵詞:OpenCV;計算機視覺技術(shù);三維模擬技術(shù)
中圖分類號:TP391 文獻標識碼:A 文章編號:1009-3044(2015)30-0137-02
21世紀是國際計算機技術(shù)高度發(fā)展的時代,人們生活中的每個角落都可以看到計算機技術(shù)的身影,尤其是現(xiàn)代計算機視覺技術(shù)和圖像處理功能發(fā)展更加迅猛,各技術(shù)分支也逐漸趨于成熟。計算機視覺技術(shù)主要指的就是利用智能計算機系統(tǒng)來代替人類的眼睛對現(xiàn)實三維世界進行辨識和理解,整個過程均是計算機自我學(xué)習(xí)的過程,而隨著這項技術(shù)研究的不斷深入,其不再僅僅包含計算機技術(shù)科學(xué),同時還涉獵了包括生理學(xué)、神經(jīng)學(xué)、物理學(xué)、應(yīng)用數(shù)學(xué)等多門學(xué)科,為人類科技的進步提供了有效的動力。
1 計算機對視頻中運動物體檢測的原理概述
在現(xiàn)代計算機技術(shù)基礎(chǔ)下,對視頻當中的運動物體檢測原理主要包括兩種,分別是從微觀和宏觀的角度出發(fā)。其中宏觀檢測技術(shù)指的是當計算機截取了視頻中的某一個圖像,其以整幅圖像為對象進行檢測;微觀檢測技術(shù)是指在截取圖像后,根據(jù)實際需求對某一區(qū)域內(nèi)的圖像內(nèi)容進行檢測。在計算機視覺技術(shù)實際應(yīng)用時,其第一步就是對圖像的采集,第二步是對已經(jīng)采集的圖像進行預(yù)分析處理,如果采用宏觀檢測技術(shù)則對圖像整體進行分析;如果采用微觀檢測技術(shù)則首先將圖像進行分割,然后對分割后各圖像內(nèi)容中出現(xiàn)的運動物體影像進行分析。在圖像數(shù)據(jù)獲取過程中應(yīng)用的是背景差分法,這一技術(shù)主要是將背景和運動物體進行分離提取,以獲取沒有背景圖像的運動物體影像數(shù)據(jù)。還可以利用幀間差分法,這種方法主要是對一個視頻圖像的逐幀畫面進行差別比較,從而獲得各幀圖像上的差值,而將這些差值幀圖結(jié)合起來就是一個物體在計算機視覺下的運動軌跡。現(xiàn)代研究者更傾向于將背景和幀間差分法進行結(jié)合運用,這樣可以獲得無背景下的運動物體軌跡,進而提升計算機視覺系統(tǒng)捕捉數(shù)據(jù)的準確性。
2 OpenCV的應(yīng)用概述
OpenCV是現(xiàn)代計算機視覺技術(shù)當中具有開源性的視覺庫,其最早是由俄羅斯Intel分公司所研發(fā),不僅高效,而且具有兼容的優(yōu)勢。同時與傳統(tǒng)IPL圖像處理系統(tǒng)相比,OpenCV所處理的圖像數(shù)據(jù)等級更高,例如在對運動物體進行特征跟蹤、目標分割、運動軌跡分析以及三維模型重建等方面都有著巨大的優(yōu)勢。
OpenCV本身編輯的源代碼是開放式的,編寫過程簡潔且方便,并且程序中大多數(shù)函數(shù)已經(jīng)通過了匯編的最優(yōu)化,使其能夠更加高效地被應(yīng)用。在使用OpenCV的攝像機標定模塊已經(jīng)為用戶設(shè)計了實用性較強的接口,并且能夠支持Windows界面的操作平臺,使得這一技術(shù)的操作更加簡便。這一技術(shù)本身操作簡便,對于編程人員和檢驗人員個人技能素質(zhì)要求并不高,視覺技術(shù)系統(tǒng)研發(fā)人員可以利用簡便的操作來檢驗其設(shè)想是否能夠?qū)崿F(xiàn),這就使得現(xiàn)代計算機視覺技術(shù)開發(fā)團隊能夠形成更好的協(xié)作研發(fā)關(guān)系,進一步提升技術(shù)研究效率。目前已知OpenCV編程系統(tǒng)在航空航天定位、衛(wèi)星地圖繪制、工廠大規(guī)模生產(chǎn)視覺檢測等方面得到了廣泛的應(yīng)用,同時對于無人飛行器的視覺捕捉技術(shù)也有極大的幫助。最為重要的是OpenCV編程語言的兼容性較強,編程人員可以根據(jù)自己的意愿對源代碼進行披露,并且國內(nèi)也已經(jīng)形成了規(guī)模較大的交流社區(qū),給更多同行業(yè)者提供答疑解惑的場所,進一步擴大了OpenCV的應(yīng)用范圍。
3 基于OpenCV的計算機視覺技術(shù)
3.1 基于OpenCV下的運動物體檢測技術(shù)
在常規(guī)運動物體檢測技術(shù)下,均是直接通過圖像背景和運動物體的區(qū)分來實現(xiàn)運動物體的捕捉。而基于OpenCV下的運動物體檢測技術(shù)則不僅能夠針對于圖像背景的分離實現(xiàn)運動物體的觀察,還可通過物體本身特定的信息來進行檢測,主要包括形狀、輪廓以及顏色等。這樣就能夠?qū)崿F(xiàn)在復(fù)雜的背景當中將特定的運動物體完整抽離出來。其基本流程包括:首先,對影像數(shù)據(jù)當中某一時間點的圖像進行捕捉,然后對這一視頻圖像的格式進行轉(zhuǎn)化;其次,對轉(zhuǎn)化格式后的視頻圖像進行早期處理,并將運動物體和復(fù)雜的背景區(qū)分開,降低周圍各環(huán)境因素對運動物體主體圖像的影響;第三,根據(jù)完成提取后的運動物體圖像進行辨識,然后再從視頻當中捕捉擁有相同特征的物體,并對該物體進行跟蹤識別。而這一過程的實質(zhì)則在于先利用圖像捕捉技術(shù)對畫面進行截取,然后同時利用背景差分法和幀間差分法對圖像進行分割,逐幀地將運動物體完成提取出來,以供計算機進行視覺跟蹤處理。
3.2 基于OpenCV的圖像預(yù)處理技術(shù)
一般情況下,計算機視覺處理技術(shù)應(yīng)用的環(huán)境情況較為復(fù)雜,大多數(shù)應(yīng)用環(huán)境當中均有光照的變化,并且部分計算機視覺處理設(shè)備還需要在露天環(huán)境下進行工作,此時周圍環(huán)境中的風(fēng)、溫度、光照、氣候以及運動物體數(shù)量等對視頻圖像的采集均有著極大的影響。環(huán)境因素會使圖像采集的質(zhì)量大幅度降低,同時圖像當中的噪點問題也難以避免,而噪點是視覺捕捉和圖像處理當中最大的影響因素。因此,在基于OpenCV下的計算機視覺技術(shù)在捕捉視頻圖像之后先對其進行預(yù)處理,然后再由系統(tǒng)對運動物體進行分離、檢測和跟蹤。一般的預(yù)處理過程主要包括平滑度濾波、圖像填充、背景實時更新等。
1)圖像的平滑度濾波預(yù)處理技術(shù)
由于在實際計算機視覺捕捉過程中圖像噪點是難以避免的問題,以此在對圖像中運動物體進行檢測前,應(yīng)該相對這些噪點進行預(yù)處理,降低環(huán)境噪聲對圖像的影響。圖像的平滑度濾波處理共分為兩種方式,分別為線性和非線性。其中線性處理方式就是通過計算機處理設(shè)備的簡單運算,對圖像當中的噪點進行直接清除,但這一技術(shù)使用后會造成截獲圖像模糊不清的情況,因此僅對噪點較少的圖像采用該處理方式;非線性濾波處理則是利用復(fù)雜的圖像處理運算,將截獲圖像當中的噪點無限縮小,使其不對圖像整體造成影響,并且可以有效保證圖像的局部調(diào)整,但這種處理方式在運算時速度沒有線性濾波處理快,因此需應(yīng)用在噪點較多,圖像信息較復(fù)雜的處理當中。
2)圖像的填充預(yù)處理技術(shù)
這一處理技術(shù)在使用過程中運算速度較慢,主要是由于其需要對逐幀的圖像均進行處理,也包括兩種處理方式,分別為邊緣填充和腐蝕膨脹處理。其中邊緣填充處理主要指的是在確定運動物體之后,利用計算機系統(tǒng)自身的邊緣檢測處理技術(shù),對物體的輪廓進行辨識,并利用形態(tài)學(xué)上的漫水填充方式對運動物體周圍的噪點進行顏色填充,減小其對畫面整體元素的影響。而腐蝕膨脹處理與邊緣填充處理原理相類似,但這種處理技術(shù)主要是針對于噪點進行腐蝕和膨脹,使其在畫面當中所占比例擴大,但對運動物體本身不造成影響,這使運動物體和噪點之間的差異就會更加明顯,就可以將噪點的影響降到最低,但這種處理方法的效果和攝像機本身的性能、質(zhì)量等有著密切的關(guān)聯(lián)。
3)背景的實時更新預(yù)處理技術(shù)
在進行運動物體和背景分離過程中,計算機系統(tǒng)需要對圖像上的背景元素進行辨識,并對其開展初始化處理,這樣就能夠為后期實時背景圖像的差異進行凸顯,以增加前景圖像的效果,降低噪點對圖像的影響。在運用這一技術(shù)時,首先要先對第一幀的圖像進行確定,并將第一幀圖像當中的背景圖像元素進行辨識,然后在后期圖像更新和運動物體檢測過程中對背景進行實時更新處理。在更新的過程中其流程主要包括:首先,系統(tǒng)要對所讀取的畫面進行有效的判斷,了解該圖像是否為第一幀;其次,將Opencv處理的圖像轉(zhuǎn)變?yōu)閱瓮ǖ阑叶戎担坏谌瑢D(zhuǎn)變后的圖像進行高斯平滑度濾波處理,將圖像當中的噪點進行去除;第四,采用形態(tài)學(xué)噪點填充技術(shù)對圖像當中的噪點進行二次處理,以獲得所需要更新的背景圖像。
3.3 前景運動物體的提取技術(shù)
在計算機視覺技術(shù)進行運動物體的檢測時,只有有效保障檢測流程的準確度,才能夠有效保障對前景運動物體的跟蹤效果。其主要分為兩大步驟,其一是對二值化后的圖像數(shù)據(jù)進行分割處理;其二是在圖像分析前對其進行充分的填充處理,保證前景圖數(shù)據(jù)的完整性。同時,在前景圖像提取的過程中也分為多個步驟,其包括:首先,對所提出的前景圖像和背景圖像進行差分處理;其次,將差分處理后的圖像二值化處理;第三,對背景當中前景物體的輪廓或邊緣進行辨識,根據(jù)前景圖像的輪廓對其進行填充。由于在實際操作過程中,攝像頭所處環(huán)境的變化較大,并且會在不同場所內(nèi)的不同角度捕捉畫面,因此就需要在前景圖像提取時有效提高背景圖像實時更新的效果。
利用閥值二值化的分割方式能夠有效將前景圖像和背景圖像分離開,從而使目標運動物體能夠呈現(xiàn)獨立化,并且閥值分割方式開展前要相對每個像素點進行確定,判斷其是否位于灰度值的范圍內(nèi)。而將該圖像的像素灰度和閥值進行對比后會出現(xiàn)兩種結(jié)果,分別是灰度值低于或高于閥值。在實際應(yīng)用過程中,有效確定圖像的分割閥值T,就能夠降低環(huán)境當中光照因素對圖像質(zhì)量的影響。
4 計算機視覺技術(shù)當中的三維重建技術(shù)
1)三維重建的視覺系統(tǒng)
計算機視覺技術(shù)在對圖像進行捕捉時可以視為是對大量的圖像信息進行處理,從攝像機的視覺角度出發(fā),其所輸入的圖像一般為二維屬性,但輸出的信息確是三維數(shù)據(jù),而這種三維空間數(shù)據(jù)能夠提升對運動物體所處空間位置、距離等描述的準確性。在三維重建視覺系統(tǒng)工作過程中,其相對基本的圖像數(shù)據(jù)框架進行確定,然后利用一個坐標點建立2.5D圖像數(shù)據(jù),即以此點為視角能夠觀察到的圖像數(shù)據(jù),再將2.5D圖像數(shù)據(jù)進行整合從而建立三維圖像。
2)雙目視覺系統(tǒng)
當人體利用雙眼在不同角度、同一時間內(nèi)觀察同一個物體時,就可以利用算法來測量該物體和人體之間的距離,而這種方法也被稱為雙目立體感,其應(yīng)用的原理主要是人體視覺差所帶來的影響。同時利用兩臺攝像機對同一圖像從不同角度進行觀察,就能夠獲得人體雙目觀察后的效果,因此這一三維重建技術(shù)也被稱為“雙目視覺系統(tǒng)”。兩臺不同的攝像機即可代表人體雙眼,其對圖像進行逐幀捕獲,但由于角度不同和環(huán)境影響因素的差異,因此造成了圖像差異,必須對其捕捉的圖像進行預(yù)處理。
3)三維重構(gòu)算法
在計算機視覺技術(shù)中對于視頻流的采集主要依靠的是彩色攝像機、紅外攝像機、紅外接收攝像頭等設(shè)備。還可以利用微軟所提供的Kinect設(shè)備,在進行運動物體檢測前能夠?qū)UI進行初始化處理,將系統(tǒng)內(nèi)函數(shù)的參數(shù)設(shè)定為用戶信息深度圖、彩圖、骨骼追蹤圖等數(shù)據(jù)。在使用Kinect設(shè)備對視頻流進行打開時,其可以遵循三個步驟,其一是彩色和深度數(shù)據(jù)的處理;其二是根據(jù)數(shù)據(jù)的索引添加顏色信息,并將其引入到深度圖數(shù)據(jù)當中;其三是骨骼追蹤數(shù)據(jù)。
5 結(jié)束語
計算機視覺捕捉技術(shù)是現(xiàn)代計算機應(yīng)用當中較為先進的內(nèi)容,其應(yīng)用范圍較廣,對于運動物體的捕捉準確度較高,能夠有效推進現(xiàn)代計算機模擬技術(shù)的發(fā)展。
參考文獻:
[1] 張海科.基于Opencv的人手識別與跟蹤定位技術(shù)研究與實現(xiàn)[D].昆明: 云南大學(xué),2013.
關(guān)鍵詞:計算機;視覺檢測技術(shù);原理;應(yīng)用
中圖分類號:TP391.41
受到CIMS的推動和影響,諸多企業(yè)的發(fā)展趨勢逐步趨向于個性化以及自動化,這種大的發(fā)展趨勢間接的對我國的計算機輔助技術(shù)提出了更高的要求,計算機相關(guān)技術(shù)的發(fā)展面臨著更加嚴峻的挑戰(zhàn)。就現(xiàn)階段分析來看,計算機輔助檢測技術(shù)在現(xiàn)代諸多企業(yè)中得到了廣泛的應(yīng)用。隨著柔性制造系統(tǒng)的不斷進步與發(fā)展,驅(qū)動圖像處理軟件、現(xiàn)場總線技術(shù)的日趨成熟,檢測系統(tǒng)的靈敏性、智能化特點愈發(fā)受到人們的關(guān)注,在這種大的發(fā)展趨勢之下,計算機視覺檢測技術(shù)得到了較快的發(fā)展。基于計算機視覺系統(tǒng)現(xiàn)已經(jīng)廣泛應(yīng)用于現(xiàn)場監(jiān)控、工況監(jiān)視等諸多環(huán)境之中。
1 關(guān)于對視覺技術(shù)的相關(guān)研究
1.1 基于計算機的視覺檢測技術(shù)的原理分析和探究
圖像技術(shù)主要指的就是通過各種途徑所實現(xiàn)的對圖像的獲取以及進一步的深入加工和處理技術(shù)。根據(jù)視覺檢測技術(shù)的抽象程度以及對圖像處理方式的不同,可以大致將圖像的處理和加工技術(shù)劃分為三個最主要的層次,這三個層次分別是圖像的加工處理、圖像的分析以及對于圖像的理解。將這三個層次進行進一步的結(jié)合,便是圖像工程。計算機視覺檢測技術(shù)是一門新興的計算機檢測技術(shù),該技術(shù)建立在對計算機視覺研究的基礎(chǔ)之上,吸收和借鑒相關(guān)的研究成果,借助于傳感器來實施三維測量,進而有效獲得被測物體的空間具置信息,故而可以很好的滿足當代制造業(yè)的發(fā)展需求。區(qū)別于一般的圖像處理系統(tǒng),計算機視覺檢測技術(shù)所獲取的相關(guān)數(shù)據(jù)信息更為精準和迅速,其環(huán)境適應(yīng)性更強。
基于計算機的視覺檢測技術(shù)注重計算理論的輔導(dǎo)作用,以應(yīng)用為目標進行視覺技術(shù)分析。自上世紀七十年代以來,我國關(guān)于對計算機視覺檢測技術(shù)的研究又取得了顯著的進步,并且逐步邁入更為實質(zhì)性的研究階段,在該階段中,逐步開始從通過從多個角度(諸如光學(xué)角度、生理學(xué)角度以及投影射影角度等等)對其成像問題加以分析。以Marr為代表的專家更是建立了一些一般性的視覺性處理模型來輔助該技術(shù)的研究。
1.2 視覺檢測技術(shù)中傳感器的作用
在計算機的控制下配有相關(guān)的視覺檢測系統(tǒng),在該視覺檢測系統(tǒng)中,主要有三個主要方面的主要作用:第一,對于視覺傳感器模型的分析以及確定;第二,進行圖像數(shù)據(jù)分散與整理的相關(guān)工作;第三,CAD模型的建立。傳感器的主要作用就是對測量棒材的多個截面進行分析,將所收集得到的數(shù)據(jù)經(jīng)由圖像采集卡采集后,傳到相關(guān)的圖像處理系統(tǒng)中,進而進一步輔助準確的模型的建立。
2 基于計算機的視覺檢測技術(shù)的應(yīng)用研究分析
2.1 基于計算機的視覺檢測技術(shù)的發(fā)展狀況研究
在研究的初步階段,相關(guān)技術(shù)人員借助于數(shù)字化的圖像處理技術(shù),主要就是為了進一步提高所獲得的數(shù)字照片的清晰度和質(zhì)量要求,進而更為精準、科學(xué)、規(guī)范的對照片所提供的信息加以辨別,為航空衛(wèi)星圖片的讀取、識別和分類做準備。在這一系列的視覺工作中,其中最為主要和常見的工作主要是包括分類、識別判讀以及三維結(jié)構(gòu)的構(gòu)建。
基于計算機的視覺檢測技術(shù)借助于對計算機視覺技術(shù),將所獲得的被觀察物品的相關(guān)信息加以信號轉(zhuǎn)換,并傳遞給圖像處理系統(tǒng),圖像處理系統(tǒng)通過甄別和判斷不同照片像素的分布和亮度等訊息,將其進一步轉(zhuǎn)換成為數(shù)字化信號,接下來由計算機的圖像系統(tǒng)抽出符合目標特征的信號加以運算,對下一步的設(shè)備動作加以決定和執(zhí)行。
就現(xiàn)階段而言,我國的計算機視覺檢測技術(shù)系統(tǒng)在諸多領(lǐng)域均有所應(yīng)用,最為典型的領(lǐng)域諸如醫(yī)學(xué)的輔助診斷、機器人的感應(yīng)系統(tǒng)、智能化的人機接口等均是建立在該技術(shù)的基礎(chǔ)之上。借助于計算機視覺技術(shù)這一手段,可以有效提高對產(chǎn)品檢測的效率,提高精準度,這種新型的視覺檢測技術(shù)相比較于傳統(tǒng)的人眼在流水線上的跟進,其具有顯著的優(yōu)越性,其獲取測量結(jié)構(gòu)迅速、檢測結(jié)果可以直接被觀察、可以進行自動識別以及定位準確和實時性的特點,這就很好的避免了由于人的一些主觀性因素所導(dǎo)致的誤差出現(xiàn)。
二十世紀以來,基于生物特性的計算機視覺檢測技術(shù)得到了空前的發(fā)展,具體表現(xiàn)在人臉識別、生硬識別、指紋識別以及虹膜的識別中,形式日趨靈活和復(fù)雜多變。借助于計算機的視覺檢測技術(shù),可以有效對用戶的身份進行鑒定和識別、判定用戶的特殊信息等。除此之外,還可以將基于計算機的視覺識別技術(shù)逐步推廣到其他領(lǐng)域,如海關(guān)的安全檢查以及出口、入口的安全控制等領(lǐng)域。
2.2 基于計算機的視覺檢測技術(shù)的相關(guān)應(yīng)用分析
2.2.1 數(shù)碼相機中所采用的圖像采集技術(shù)
視覺檢測技術(shù)的一個顯著特點就是有效提高了生產(chǎn)的柔性和自動化程度,本世紀以來,數(shù)碼相機憑借其高分辨率,快速成像、顯像,功能豐富多變以及性價比較高的特定風(fēng)靡全球,逐步取代了傳統(tǒng)的照相機,傳統(tǒng)的照相機主要采用的是CCD 攝像頭,其主要的核心及時采集卡,顯然這種采集系統(tǒng)已經(jīng)逐步落后于時展的腳步,現(xiàn)已逐步被淘汰。
2.2.2 微文字識別系統(tǒng)的相關(guān)研發(fā)和設(shè)計
隨著科學(xué)技術(shù)的不斷進步與發(fā)展,大規(guī)模集成電路得到了較快的進步,基于計算機的視覺檢測系統(tǒng)的成本得到了極大的降低,基于計算機視覺檢測技術(shù)的微文字識別系統(tǒng)的研發(fā)也被提到了日程中來。微文字識別系統(tǒng)的處理芯片大多是借助于數(shù)字信號處理芯片來實現(xiàn)圖像的識別,進而借助先進的語音合成技術(shù)將朗讀變?yōu)榭赡堋4送猓瑸榱吮阌谑褂茫撓到y(tǒng)的體積被盡可能的縮小,并且可根據(jù)美觀度和實用性等設(shè)計為各種形狀。
2.2.3 特殊用紙水印在線檢測系統(tǒng)
基于計算機的視覺檢測技術(shù)可以在某一特定領(lǐng)域代替人的主觀判斷,諸如水印質(zhì)量的自動檢測方面。區(qū)別于普通的工作人員,計算機可以實現(xiàn)長時間工作,對于誤差范圍的控制可以通過設(shè)置等實現(xiàn),而且在計算機執(zhí)行任務(wù)期間,所受到的客觀和主觀因素相對較少,這就極大程度上避免了由于人的因素所導(dǎo)致的失誤性操作,進而有效提高了工作效率以及檢測的精準度。這一優(yōu)點,在水印質(zhì)量標準的認定中具有十分重要的意義和作用,通過研發(fā)一定的程序和軟件,可以制定出一套操作性強、權(quán)威性較高的水印清晰度量化標準。
3 基于計算機的視覺檢測技術(shù)的發(fā)展展望
綜合分析來看,計算機視覺檢測技術(shù)現(xiàn)已有大約四十年的歷史,作為一種新興的檢測技術(shù),該技術(shù)的顯著優(yōu)越性不言而喻,該檢測技術(shù)以其高精度、反應(yīng)靈敏迅速、智能化、自動化等特點被廣泛應(yīng)用于諸多領(lǐng)域和行業(yè)之中,并取得了顯著的成,可以說,該技術(shù)具有十分廣闊的發(fā)展前景。但是,不可否認,基于計算機的視覺檢測技術(shù)并不是十分的成熟,在其設(shè)計和研發(fā)過程中仍然存在著諸多不足,而且視覺檢測技術(shù)是一項設(shè)計到心理、生理等多方面知識的復(fù)雜性技術(shù),涉及領(lǐng)域眾多,更強大功能的實現(xiàn)需要人類知識的不斷拓展和延伸,因此,必須意識到該檢測技術(shù)發(fā)展道路上的困難和挑戰(zhàn)。
4 結(jié)束語
隨著科學(xué)技術(shù)的不斷進步與發(fā)展,經(jīng)濟的發(fā)展對于新技術(shù)的研發(fā)提出了更高的挑戰(zhàn),再者由于廣大人民群眾生活質(zhì)量的不斷提高,對于生活水平也有了進一步的認識和了解。基于計算機的視覺檢測技術(shù)的研發(fā)和進步,無疑更好推動了高速發(fā)展的經(jīng)濟,不斷滿足了人民群眾日益提高生活需求。由此來看,深入對視覺檢測技術(shù)的研究和探究無疑具有十分重要的作用,筆者衷心希望,以上關(guān)于對我國基于計算機的視覺檢測技術(shù)的相關(guān)探究能夠被相關(guān)負責(zé)人合理的吸收和采納,進而更好的推動科學(xué)技術(shù)的創(chuàng)新和進步,推動經(jīng)濟的不斷進步與發(fā)展。
參考文獻:
[1]李旭港.計算機視覺及其發(fā)展與應(yīng)用[J].中國科技縱橫,2010(06):42.
[2]張江明,張娟.淺談制造業(yè)中計算機視覺檢測技術(shù)的應(yīng)用與發(fā)展[J].科技創(chuàng)新導(dǎo)報,2011(24):1.
關(guān)鍵詞:計算機視覺;智能交通;監(jiān)控系統(tǒng)
中圖分類號:TP277
近些年來,隨著我國人民生活水平提高,使私家車輛的數(shù)目急劇增長,并且車輛的增長速度遠遠超出市政建設(shè)的力度。這樣的事實導(dǎo)致城市交通擁堵、違規(guī)通車、車禍增加,所以迫切的要求加快市政建設(shè),實施高效率的交通監(jiān)控措施,基于計算機視覺的智能交通監(jiān)控系統(tǒng)也由此得到了相應(yīng)的廣泛的發(fā)展和應(yīng)用。那么,計算機視覺技術(shù)下的智能交通監(jiān)管系統(tǒng)究竟應(yīng)該如何設(shè)計與實現(xiàn)呢?
1 計算機視覺下的智能交通監(jiān)控系統(tǒng)
1.1 計算機視覺技術(shù)
計算機視覺技術(shù)即利用各種圖像攝錄設(shè)備將通過對視覺目標進行識別、跟蹤、測量并將由此獲取的視覺信息傳輸至計算機并進而利用圖像技術(shù)進行視覺信息處理以達到進一步進行智能化處理的視覺處理技術(shù)。
1.2 智能交通系統(tǒng)(ITS)
智能交通系統(tǒng)(ITS)是指通過現(xiàn)代化的網(wǎng)絡(luò)信息技術(shù)、自動控制技術(shù)等有效綜合手段在一定范圍內(nèi)建立的全方位發(fā)揮作用的交通運輸綜合管理和控制系統(tǒng)。作為交通運輸管理體系的一場新的革命,近年來,由此技術(shù)進一步開發(fā)形成的監(jiān)控系統(tǒng)已經(jīng)在各個道路的關(guān)鍵路口、路段和其他交通繁忙地域普遍建立,為交通運輸管理提供了自動化、智能化的信息收集和處理等多方面的服務(wù)。但是,隨著城市建設(shè)的迅猛發(fā)展和人流、車流量的猛增,更加智能化的交通管理系統(tǒng)的開發(fā)和利用顯然也成為了當務(wù)之急。
2 計算機視覺下的智能交通監(jiān)管系統(tǒng)的建立
正是基于新的發(fā)展需要,我們有必要把計算機視覺和智能交通監(jiān)控系統(tǒng)進一步結(jié)合起來,首先通過計算機視覺分別對各個道路的關(guān)鍵路口、路段和其他交通繁忙地域等相應(yīng)位置實時進行交通信息采集,然后,通過信息傳輸系統(tǒng)、或者進行處理后存入服務(wù)器并將處理過的實時交通信息及時傳輸?shù)奖O(jiān)控指揮系統(tǒng),以實現(xiàn)對于各個道路的關(guān)鍵路口、路段和其他交通繁忙地域的實時監(jiān)控和管理。由此,顯然就需要設(shè)計以下各個子系統(tǒng)并共同構(gòu)建為一個完整的體系。
計算機視覺下的智能交通監(jiān)管系統(tǒng)
實時交通信息收集系統(tǒng)
監(jiān)控指揮系統(tǒng)
高質(zhì)量信息存儲傳輸系統(tǒng)
圖1 計算機視覺下的智能交通監(jiān)管系統(tǒng)工作程序示意圖
3 智能交通監(jiān)控系統(tǒng)的實現(xiàn)
計算機視覺下的智能交通監(jiān)管系統(tǒng)實現(xiàn)的第一步是通過實時交通信息收集系統(tǒng)實時進行交通信息采集,即通過對于運動物體的分割,在圖像找出有意義的部分,抽出運動目標的特征,進而通過連續(xù)畫面間的變化判斷目標的運動狀況。在這一系統(tǒng)運行中,首先可以“攝像頭讀入”的初始視頻,使用相應(yīng)的算法提取“背景”,然后通過原圖與背景運算形成相應(yīng)的“前景”,由此即可進一步通過矩形框的使用來達到“運動目標檢測”與信息采錄的目的。
圖2 視覺監(jiān)控系統(tǒng)原理圖
3.1 系統(tǒng)功能實現(xiàn)
對運動物體的檢測主要有光流法以及差分法兩種方法,由于光流法比較復(fù)雜和耗時,實時檢測很難實現(xiàn),因而,現(xiàn)有實時交通信息收集系統(tǒng)一般通過差分法的應(yīng)用來進行開發(fā)和實現(xiàn)。
3.1.1 幀間差分法
幀間差分法對運動目標進行分割處理過程中使用較多也最為簡單實用的一種方法,其基本原理就是通過在連續(xù)的圖像序列中兩個或三個相鄰幀間采用基于像素的幀間差分并且閾值化來提取圖像的運動區(qū)域,進而通過逐象素比較獲取前后兩幀圖像之間的差別來判斷運動物體的移動狀況。在實際操作中,一般可以假設(shè)用于獲取序列圖像的視頻設(shè)備為靜止物體,設(shè)視頻中連續(xù)兩幀的圖像為It(x,y)和It+1(x,y),然后通過對連續(xù)兩幀的圖像相應(yīng)的像素進行比較,利用Dt(x,y)=It+1 (x,y)-It(x,y)這一方程求出相應(yīng)的閾值來檢測出運動物體的移動狀況:
Mt(x,y)=
當然,必須注意的是,由于幀間差分法所得到的差分圖像在現(xiàn)實中并非由理想封閉的輪廓區(qū)域組成的,因而,運動目標的輪廓自然也就往往是局部的、不連續(xù)的,且其誤差往往隨著運動物體速度的增大而增大,因而,這一方法并不適于對于高速運動目標的有效檢測。
3.1.2 背景差分法
與幀間差分法不同,背景差分法則是利用當前圖像與背景圖像的差分來檢測物體運動狀況一種方法。其基本原理是在可控制環(huán)境下,通過對于運動背景的固定假設(shè),設(shè)待檢測運動物體的圖像為I(x,y),背景圖像為B(x,y),通過輸入圖像與背景模型進行比較,利用D(x,y)=I(x,y)-B(x,y)這一方程求得到圖像中的各像素的變化信息,進而檢測運動物體的移動狀況:
Mt(x,y)=
當然,在實際運用中,背景差分法的關(guān)鍵,是要建立一個背景模型,并更新模型。
3.2 程序功能的實現(xiàn)
本程序功能實現(xiàn)所主要使用的是OpenCV函數(shù)。OpenCV能夠?qū)崿F(xiàn)對圖像數(shù)據(jù)的操作,包括分配、釋放、復(fù)制、設(shè)置和轉(zhuǎn)換數(shù)據(jù),以及對攝像頭的定標、對運動的分析等。在函數(shù)實現(xiàn)上,用到了Cv圖像處理的連接部件函數(shù),運動分析與對象跟蹤中的背景統(tǒng)計量的累積相關(guān)函數(shù)等相關(guān)的函數(shù)。本系統(tǒng)就是運用圖3介紹使用到的函數(shù)名及其功能和使用格式等來實現(xiàn)對視頻流的運動車輛的輪廓檢測的。
圖3 尋找輪廓程序主要算法流程
實驗證明,本系統(tǒng)能夠較好地實現(xiàn)對視頻流的運動目標的輪廓檢測和對象跟蹤,并能實時更新背景,車輛跟蹤正確率在95%以上,雖然存在著輪廓檢測正確率稍差的缺點,但其主要原因是由于攝像頭所處的角度和運動目標靠近程度的影響,從根本上并不影響對于運動目標的實際檢測。
4 結(jié)束語
加快城鎮(zhèn)化進程是我國發(fā)展的大趨勢,在這一趨勢下,城市病的治理當然可以離不開現(xiàn)代化的科學(xué)技術(shù)。但是,必須注意的是,無論多么先進的管理系統(tǒng),最終都只有通過人的行為才能夠發(fā)揮有效的作用,在這個意義上,設(shè)計與使用先進的交通監(jiān)控系統(tǒng)固然是解決交通問題的技術(shù)條件,但是,交通問題的解決,最終還必須依賴于人的素質(zhì)的全面提高。
參考文獻:
[1]戴俊喬.城市道路交通視頻監(jiān)控系統(tǒng)架構(gòu)和性能的研究[J].科技與創(chuàng)新,2014(06).
[2]張偉龍,李剛,王雨翔.基于計算機視覺的智能交通監(jiān)控系統(tǒng)[J].小型微型計算機系統(tǒng),2014(07).
[3]龐其富.淺談城市軌道交通視頻監(jiān)控系統(tǒng)設(shè)計方案[J].通訊世界,2014(01).
提起數(shù)字媒體,人們通常會想到傳媒行業(yè),其實數(shù)字媒體的應(yīng)用絕不局限于傳媒。隨著寬帶網(wǎng)絡(luò)的普及,人們在日常業(yè)務(wù)處理過程中,正面對越來越豐富的網(wǎng)上媒體和內(nèi)容,包括各種視頻、音頻、文本、圖像等。下面,就讓我們跟著諸位數(shù)字媒體方面的專家一起來分享這個繽紛的世界。
三維幾何建模與形狀表示
北京大學(xué)視覺與聽覺信息處理國家重點實驗室主任教育部長江學(xué)者獎勵計劃特聘教授 查紅彬
精彩問答
在背景比較復(fù)雜、有干擾的情況下模型檢索的效果怎么樣?
在模型檢索的時候并沒有考慮背景,因為這是做模型檢索比較容易的部分。模型檢索一般是沒有背景的,但也可以做,但是要推廣到背景比較復(fù)雜的物體上識別可能有很大的問題,因為這時候匹配不僅僅是局部匹配,而是兩個子集和子集的匹配問題,到目前為止,我們只是做沒有背景的模型檢索。
為什么要重新談?wù)撊S形狀表示問題?在多媒體信息處理領(lǐng)域里面,有兩個比較重要的方向,這也是計算機科學(xué)技術(shù)領(lǐng)域里兩個重要的方向,一個是計算機視覺,一個是計算機圖形學(xué)。計算機視覺是從圖像中通過識別或重建處理,得到一個對對象物的描述。反過來說圖形學(xué),是對一個對象和場景的描述,通過繪制和動畫生成圖像和視頻。它們從處理過程來說是逆過程,這兩個領(lǐng)域之間有密切的關(guān)聯(lián)。
我們現(xiàn)在考慮計算機三維建模或模型的描述,考慮的不僅僅是計算機視覺或計算機圖形學(xué)所包含的內(nèi)容。這里面簡單列舉一下,比如基于模型的三維物體識別和場景識別,這兩個應(yīng)該是典型的計算機視覺里面考慮的應(yīng)用。除了這以外還可以用模型干別的事情,比如繪制,還包括基于這樣模型的設(shè)計、變形、動畫等等。除了兩個單獨研究的應(yīng)用之外,還要想怎么把兩者結(jié)合起來,把虛擬和真實的東西無縫連接到一起,這些都牽涉到三維模型。
我們考慮的三維模型跟以前相比,應(yīng)用領(lǐng)域大了很多,要達到這個要求,對模型的表達、形狀的表達也都有了更高的要求。
怎樣找到一些更新更有效地表達形式來符合這些要求呢?這里有四個方面,現(xiàn)在能不能建立一個形狀空間,把考慮的對象完整地在形狀空間里面表達出來。第二點就是針對形狀的特性,表達要具有柔性,對象物的表面不都是連續(xù)的,也有一些非連續(xù)性和不規(guī)律性,這些特性怎樣能夠進行柔性處理。第三個是需要一些描述是局部性的,另外一些要求描述是整體性的,這兩者之間如何有一個很好的結(jié)合方法。第四是在大量的計算當中,包括變形和動畫中有很多編輯的工具,所以我們要求對現(xiàn)在的形狀表達有一些比較高的要求。
在計算機視覺里面有一個老大難就是識別,已有模型,但是眼前看到的是一部分三維數(shù)據(jù),怎么用這部分數(shù)據(jù)和模型數(shù)據(jù)匹配來識別它呢?這就牽涉到局部匹配,我們要解決局部匹配需要什么描述?我們要有一個模型,從大量的數(shù)據(jù)中建立一個模型庫,并從中抽取很多特征,把這些特征進行組織。這里面牽涉三個比較大的問題,第一個是形狀空間怎么構(gòu)造,沒有很好的特征表達或整理的形式,后面的匹配以及其他的工作就很難做。第二個是怎么定義基于這種特征的相似度。第三個是怎樣在形狀空間當中搜索到最優(yōu)的匹配。
針對這些問題我們最近一兩年做了一些工作,最近提出一個廣義形狀分布(Generalized Shape Distributions)描述方式,主要目的有兩點,能不能在三維形狀表示過程當中,找到一些最關(guān)鍵的描述指令,并從中找到相互關(guān)系,把整體和局部結(jié)合起來。如果把之間的關(guān)系描述出來,就能把局部結(jié)構(gòu)性的信息用整體觀點加進去,這兩件工作就是我們做這件事情的主要目的。
在形狀描述問題上,我們還有很多工作要做,除了局部、整體描述之外,我們要想辦法把他們結(jié)合到一起。今后幾年要用更多的模式識別的辦法,來解決面臨的圖形學(xué)或虛擬現(xiàn)實和計算機視覺當中的很多問題。
生活中的計算機視覺
香港中文大學(xué)信息工程系終身教授
微軟亞洲研究院視覺計算組負責(zé)人 湯曉歐
精彩問答
微軟亞洲研究院視覺計算組在原創(chuàng)思想這一塊,引領(lǐng)下一個方向有沒有什么考慮,您談到很多對人們?nèi)粘I钣绊懞艽蟮膽?yīng)用,但是在背后的更深層的考慮,更新的創(chuàng)意在哪里呢?
我們的研究者都很年輕,我本人也才工作七年的時間,很多的算法已經(jīng)發(fā)展這么多年了,所以在開始的時候比較容易想出來的方法,現(xiàn)在已經(jīng)很難有那么多的原創(chuàng)內(nèi)容。我們的工作是去找一些非常原創(chuàng)的內(nèi)容,有的是理論上的,有的是新的發(fā)明,這可以有很大的影響。
圖像通過閃光燈的分割,前景和背景深度差會不會影響分割效果,距離會不會影響分割效果呢?
我們這個通過閃光燈對圖像進行分割的技術(shù),會一定程度上受到光的強度和距離的影響。
我們主要的研究領(lǐng)域包括計算機視覺、模式識別、圖像處理和視頻處理。下面就為大家介紹幾個比較典型的應(yīng)用。
如何將圖片的前景和后景分離?我們現(xiàn)在照兩張圖片,一張打閃光燈,一張沒有打閃光燈,這樣拍出來的照片背景沒有變化,但前景變化很厲害。在開閃光燈的情況下拍的照片,前景和后景可以利用一些技術(shù)很容易地分開來。
把一個圖片的前景切割出來放入另一張圖后,那剩下的圖片缺一塊的怎么辦呢?如何修復(fù)剩下的圖片呢?在例舉的圖片上,大家可以看到不同的區(qū)域,我們可以由一個算法,從其他的地方借過來,再貼上去,經(jīng)過這樣的處理后,圖像基本上和原來沒有太大的區(qū)別。
如此的修修補補又有什么用呢?比如說,你對這張圖像不是很滿意,你可以把圖片上不喜歡的部分劃出來,然后利用一些技術(shù)將劃出來的空白部分填上。更有用的地方在于,你照了不想被別人看到的照片后,除了刪除,你多了一個選擇。你可以把不想讓別人看到的照片部分去掉,并利用一些算法把空白的地方填補上,而且讓別人看不出來。
現(xiàn)在大家的電腦上都會有很多照片,怎么快速地瀏覽這些照片呢?我們可以把這些圖像都放在一個屏幕上,可屏幕畢竟有限,怎么才能把照片放得更多一些呢?我們現(xiàn)在做的是可以隨機把照片放到桌面上,但是電腦會對每張照片上的重要信息進行篩選,在放盡可能多的照片的同時,讓每張照片上最重要的信息不被遮掩,而且均勻地分布在桌面上。這樣大家看起來就更清楚了。這個算法就是怎么讓所有圖像均勻分布,同時把所有背景都要蓋上。我們可以對圖像進行各種處理,同時我們也可以利用一些技術(shù)知道別人有沒有處理圖像,對圖像有沒有做過手腳。
現(xiàn)在我們來說說視頻方面。比如說抖動很厲害的圖像,怎么把物體移到中間?一個辦法是把除移動圖像外的公共部分切出來,但是移動越大,公共部分就會越來越小,更好的辦法是用一些技術(shù)把空處填上。
現(xiàn)在MSN的功能已經(jīng)越來越豐富。比如說一段電影,你看到一件比較中意的衣服,只要你把鼠標移動衣服的覆蓋范圍,你就能很清楚地知道這件衣服的品牌及價格。如果你把鼠標在那件衣服上輕點,電腦就會直接跳轉(zhuǎn)到這個衣服的相關(guān)網(wǎng)站。
你在視頻聊天的時候如果不想讓對方看到你所處的環(huán)境,你就可以很輕松地把背景模糊掉。如果大家對自己的長相不是那么有信心,我們可以幫你改變一下你的長相。為自己添一幅酷酷的墨鏡,換上一個性感的大嘴巴,這些都能輕而易舉地完成。
多媒體傳感器網(wǎng)絡(luò)
北京郵電大學(xué)教授、博士生導(dǎo)師
智能通信軟件與多媒體北京市重點實驗室主任 馬華東
傳感器研究是IT非常熱門的話題, 首先我為大家介紹一下多媒體傳感器網(wǎng)絡(luò)的基本概念。從早期的巨型機到今天的小型機,生物芯片尺寸越來越小,但是效率越來越高;網(wǎng)絡(luò)設(shè)備聯(lián)網(wǎng)和數(shù)據(jù)交換的需求越來越大,設(shè)備之間的傳輸量也越來越大;從信息處理的角度來看,內(nèi)容逐漸占據(jù)了主導(dǎo)地位,由數(shù)據(jù)為中心轉(zhuǎn)到以內(nèi)容處理為中心。這三方面的演化是今天討論多媒體傳感器的背景。
傳感器網(wǎng)絡(luò)是一組傳感器節(jié)點,由組織方式協(xié)作地感知采集和處理感知對象的信息,它的基本特點是造價低、能量敏感、通信能力有限、計算能力弱、動態(tài)變化。現(xiàn)在的需求是要求通信能力越來越強,計算能力應(yīng)付節(jié)點的處理的要求。
右圖是目前主流的傳感器節(jié)點的配置,從配置來講還是比較低的,現(xiàn)在信息處理側(cè)重壓力、溫度、光、震動等簡單的數(shù)據(jù)或者是標量數(shù)據(jù)。人類獲取信息80%是視覺信息,10%左右是聽覺信息,也就是說90%左右的信息是多媒體信息。傳感器網(wǎng)絡(luò)就是對音頻、視頻信息獲取后提供給使用者,使其對環(huán)境信息有一個全方位的了解,對傳感器網(wǎng)絡(luò)的應(yīng)用是非常廣泛的。
從網(wǎng)絡(luò)的結(jié)構(gòu)來講,基本結(jié)構(gòu)和原來傳感器網(wǎng)絡(luò)差別不是很大,這里面強調(diào)增加音頻、視頻獲取處理,網(wǎng)絡(luò)傳輸整個過程的各個環(huán)節(jié),同時這里面最好可以交互。有了這個概念以后,深入分析一下主要特點,首先是網(wǎng)絡(luò)能力的增強,這樣一個傳感器網(wǎng)絡(luò)應(yīng)該集信息的采集、處理傳輸、轉(zhuǎn)發(fā)、能量供應(yīng)等方面,除了傳統(tǒng)的標量數(shù)據(jù),音頻、視頻的圖像數(shù)據(jù),都可以進行采集處理。
現(xiàn)在多媒體傳感器網(wǎng)絡(luò)目前有哪些問題呢?從需求來看,現(xiàn)在網(wǎng)絡(luò)是異構(gòu)的信息,媒體信息的格式,種類很多,并且差異非常大,數(shù)據(jù)量比較大,特別是音頻、視頻信息,格式比較復(fù)雜。這些信息傳輸過程中需要高速實時地傳輸,對網(wǎng)絡(luò)傳輸速率也提出了比較高的要求。媒體信息的安全問題,也是網(wǎng)絡(luò)需要考慮的,還有服務(wù)質(zhì)量的問題。針對這些需求,我們可以看到,通信資源和計算資源這兩者之間存在非常大的矛盾,或者非常大的鴻溝,如何解決這兩者之間的差距就是我們研究的問題所在。
最后談一下多媒體傳感器網(wǎng)絡(luò)研究的挑戰(zhàn),首先是節(jié)點的芯片設(shè)計,這是基礎(chǔ),這里面需要采用多種技術(shù),包括軟硬件協(xié)同設(shè)計的技術(shù),各種技術(shù)結(jié)合,降低成本、能耗、體積、提高運算速度和可靠性。第二是三維場景的覆蓋問題,方向性傳感模型是一個簡單的二維圖形,實際上是三維圖形監(jiān)測,這是一個三維場景方向的問題,研究這個就復(fù)雜多了。還有一個問題是服務(wù)質(zhì)量保證問題,在新的網(wǎng)絡(luò)當中服務(wù)質(zhì)量體系是什么樣,也是研究的方向。再一個是信息處理,為了使網(wǎng)絡(luò)傳輸數(shù)據(jù)量比較快,能不能在節(jié)點做信息處理的計算。當然信息的安全也比較重要,用這些節(jié)點獲取多媒體信息怎么保證安全的質(zhì)量,使應(yīng)該看到的人看到這些信息,不應(yīng)該看到的人看不到這些信息。
在多媒體傳感器網(wǎng)絡(luò)中,我們還是做了一些工作,和一些同行學(xué)者也有一些交流,這里面也有一些質(zhì)疑,說多媒體傳感網(wǎng)絡(luò)和原來傳感器網(wǎng)絡(luò)設(shè)計初衷是不是吻合的,原來沒有想讓它處理這么多信息,原來體積比較小,加上這些信息以后,無疑使它的體積增大,這里面和初衷之間是不是有矛盾,傳感器網(wǎng)絡(luò)研究有沒有必要性,如果有必要性可行不可行,這都是我們目前研究的問題。
1視覺跟蹤算法
1.1KCF算法
KCF(KernelCorrelationFilter)核相關(guān)濾波算法通過目標樣本去訓(xùn)練判別分類器,訓(xùn)練判別分類器分析當前跟蹤的目標是被跟蹤目標周圍的背景信息還是被跟蹤目標,如圖1所示。KCF通過嶺回歸分類器的學(xué)習(xí)來完成對目標的跟蹤,通過快速傅里葉變化實現(xiàn)算法的加速運算。KCF跟蹤算法在訓(xùn)練階段,利用循環(huán)矩陣理論,對視頻目標區(qū)域進行稠密采樣,獲取正負樣本,提取方向梯度直方圖(HOG)特征,通過嶺回歸分類器分析所以樣本進行訓(xùn)練。在檢測階段,以視頻前一幀目標位置為中心進行稠密采樣,將得到的所有樣本輸入到嶺回歸分類器,經(jīng)過嶺回歸分類器的分類,得到目標的位置。
1.2TLD算法
TLD(Tracking-Learning-Detection)目標跟蹤算法由跟蹤模塊(Tracking)、檢測模塊(Detection)、學(xué)習(xí)模塊(Learning)三部分組成,如圖2所示。該算法首先由跟蹤模塊的作用是將被跟蹤目標的運動軌道處理成軌道碎片提供給學(xué)習(xí)模塊進行學(xué)習(xí),學(xué)習(xí)模塊根據(jù)跟蹤模塊的處理結(jié)果進行學(xué)習(xí)并對檢測模塊的錯誤進行分析,通過學(xué)習(xí)處理后生成訓(xùn)練樣本,檢測模塊在接收到訓(xùn)練樣本后對相關(guān)參數(shù)和目標模型進行跟新并對跟蹤模塊重新初始化,其中跟蹤模塊為中值流跟蹤器,學(xué)習(xí)模塊為P-N目標模型學(xué)習(xí)。
1.3視覺跟蹤算法改進
KCF跟蹤算法的運行速度方面和在目標環(huán)境變化不大的情況下跟蹤速度表現(xiàn)優(yōu)異,但其在被跟蹤目標出現(xiàn)遮擋、形變、跟丟后無法找回目標,反觀TLD解決了被跟蹤目標被遮擋、目標跟丟無法重新找回的情況,因此將兩個算法互相融合,取長補短能提高算法的運算速度和追蹤效果。融合方法:利用KCF克服TLD的中值流跟蹤器的缺點,將KCF替換TLD的中值流跟蹤器,能夠加快TLD的目標跟蹤速度。當被跟蹤目標在當前圖像幀中消失后,KCF會把盲目地在背景中尋找被跟蹤目標,當被跟蹤重新出現(xiàn)時,KCF算法依然在背景中尋找被跟蹤目標,導(dǎo)致跟蹤失敗,為了避免這個錯誤的方法,KCF與TLD融合的算法包含了原TLD學(xué)習(xí)模塊,當判斷目標丟失時不再盲目地在背景內(nèi)尋找目標,當目標重新出現(xiàn)時重新跟蹤目標,進一步提高算法的跟蹤性能。雖然這兩個算法的融合方法很簡單,但融合后的算法確實解決了KCF不能跟蹤被遮擋的物體以及目標跟蹤后不能找回的缺點,而且算法速度上高于原TLD算法,提高了算法的性能和適用性。
2機器人控制系統(tǒng)設(shè)計
機器人系統(tǒng)總體框架如圖4所示,USB攝像頭拍攝到的圖像信以視頻幀的形式傳入到程序中。首先先進行KCF的濾波和特征跟蹤,再經(jīng)由TLD算法的處理運算出目標狀態(tài),再通過整合模塊把得到被跟蹤目標的位置信息轉(zhuǎn)換為云臺舵機轉(zhuǎn)動命令發(fā)送,通過CH340模塊將指令由USB轉(zhuǎn)為TTL電平,機器人下位機通過STM32單片機直接或間接地控制各個模塊實現(xiàn)機器人的各個功能。STM32單片機在接收到PS2手柄模塊和CH340模塊的控制信號后,根據(jù)程序存儲器對應(yīng)的指令執(zhí)行行動,如前進、水彈槍射擊等。STM32單片機實時接收各模塊的信息,例如編碼電機的電機轉(zhuǎn)速,陀螺儀的歐拉角等,根據(jù)各模塊的信息及時調(diào)整機器人的運動狀態(tài)實現(xiàn)機器人運動底盤的靈活移動。攝像頭所拍攝的圖像信息并不會直接交給STM32單片機除了,而是先經(jīng)由上位機NUC通過視覺追蹤算法運算過后所得的控制指令發(fā)送給單片機接收,單片機接收到通過CH340轉(zhuǎn)換的控制指令后控制舵機云臺轉(zhuǎn)動追蹤目標。
3機器人目標跟蹤算法軟件設(shè)計
目標跟蹤算法軟件實現(xiàn)流程圖如圖5所示。由于該目標跟蹤算法的運算結(jié)果只返回一個跟蹤框,并沒有實際的跟蹤結(jié)果,所以需要獲取被跟蹤目標所在圖像中的坐標,獲取包圍被跟蹤目標的矩形重心后,才能方便實現(xiàn)目標跟蹤算法。計算出被跟蹤目標的矩形包圍框的重心后,先對圖像幀區(qū)域進行劃分,使用漸近式接近目標區(qū)域為核心思想,將每一幀的圖像劃分為許多相同的矩形區(qū)域。隨后根據(jù)KCF+TLD目標跟蹤算法運算得出的結(jié)果框的重心與圖像正中心對比,計算出被跟蹤目標與圖像正中心坐標的偏移量,再通過舵機控制算法計算出舵機云臺的轉(zhuǎn)動量,逐幀接近目標所在位置,達到跟蹤效果。
4系統(tǒng)視覺跟蹤算法測試
(長安大學(xué)信息工程學(xué)院,陜西西安710064)
摘要:目前計算機視覺在智能交通領(lǐng)域有著廣泛的應(yīng)用,基于三維逆投影圖的車速檢測利用計算機視覺,使用線性系統(tǒng)模型進行攝像機標定,得到透視投影矩陣,確立三維世界坐標與二維圖像序列的映射關(guān)系。通過設(shè)定檢測區(qū)域并得到該區(qū)域的對應(yīng)逆投影圖,利用車尾陰影特征檢測跟蹤車輛,得到車輛目標的位移(s)、時間(t)的關(guān)系,進行速度檢測,該算法具有較好的穩(wěn)定性。
關(guān)鍵詞 :智能交通;計算機視覺;透視投影矩陣;車速檢測
中圖分類號:TN911.73?34 文獻標識碼:A 文章編號:1004?373X(2015)16?0070?03
收稿日期:2015?03?09
基金項目:教育部博士點基金(20120205110001)
0 引言
車速檢測在交通領(lǐng)域中占有重要地位,其檢測方法包括虛擬線圈、雷達測速等傳統(tǒng)方法,以及利用計算機進行視頻分析處理的智能交通檢測方法。而在基于視頻進行車速檢測的方法中,大部分通過直接分析二維圖像得到車輛速度。由于攝像機的透視關(guān)系,二維圖像與真實物體存在很大差距,存在尺度變換和幾何形變,增加了車速檢測的難度。本文設(shè)計了一種基于三維逆投影的車速檢測方法,通過對二維圖像序列進行標定,進行圖像三維重建,得到逆投影圖像序列,該圖像序列中的車輛目標具有幾何不變性,其位置、大小與真實車輛位置、大小一一對應(yīng)。經(jīng)過檢測逆投影圖像序列中車輛目標的車尾陰影特征后,跟蹤連續(xù)幀目標,計算獲取目標速度。
1 三維標定
攝像機標定是通過確定攝像機的位置、內(nèi)外參數(shù)和建立成像模型,來確定世界坐標系中的物體和它在圖像平面上的成像之間的對應(yīng)關(guān)系。空間物體上某點的三維幾何位置與它在圖像中對應(yīng)點的相互關(guān)系是由攝像機成像的幾何模型確定的。在傳統(tǒng)攝像機標定中采用針孔模型,攝像機坐標系與世界坐標系之間的關(guān)系可以用旋轉(zhuǎn)矩陣R 與平移向量μ 來表示,因此空間中一點P 在世界坐標系和攝像機坐標系下的齊次坐標[xW ] ,yW ,zW ,1 T 和[xC ] ,yC,z C,1 T 之間存在如下關(guān)系:
式中:R 為3×3 正交單位矩陣;μ 為三維平移向量,0T = [0,0,0]。
利用針孔模型中的透視映射關(guān)系,可以將上述關(guān)系簡化為式(2):
式中:(u,v) 為一點的圖像坐標;(xW ) ,yW ,zW 為該點的世界坐標;mij 為投影矩陣M 的第i 行第j 列元素。
已知n 個點的圖像坐標和世界坐標,可以通過式(2)得到一線性方程組:
利用至少已知的6 個點對應(yīng)的世界坐標和圖像坐標,通過最小二乘法可以求解線性方程式(3)的解m,得到投影矩陣M,實現(xiàn)了三維標定[1]。
2 車輛特征提取
車輛特征提取步驟如下:
(1)設(shè)定檢測框[2]。在路面上設(shè)立一虛擬檢測框,該檢測框與實際路面貼合,長15 m,寬4 m,投影到圖像坐標形成圖1(b)所示的ABCD。
(2)恢復(fù)逆投影圖。根據(jù)式(2)可知,三維中的每一個點通過透視投影矩陣M 變換后,都可以得到圖像坐標中與之對應(yīng)的像素點。根據(jù)M 矩陣恢復(fù)該檢測框中的數(shù)據(jù),得到大小為240×600的逆投影圖,該圖中的檢測目標不存在幾何形變和尺度變換,如圖1(c)所示。
(3)車輛目標檢測。檢測框設(shè)立在路面上,所有點的z 坐標均為0,由此恢復(fù)得到的逆投影圖中xy 平面的信息是與實際對應(yīng)的真實信息。在恢復(fù)后的逆投影圖中,車尾陰影部分這一明顯特征可以表征車輛目標[3]。通過大量實驗研究表明利用車尾陰影作為車輛特征,進行車輛目標檢測可以很好地避免干擾,減小誤差。
(4)車輛目標提取。在獲得的逆投影圖像中提取目標,本文通過檢測圖像中車輛目標的車尾陰影作為車輛特征,進行連續(xù)圖像序列幀中的目標跟蹤。圖1(d)中MN為車尾陰影位置所在像素行,該像素行與三維實際坐標一一對應(yīng),通過三維坐標距離與逆投影圖大小的對應(yīng)關(guān)系可以得到車尾所在像素行對應(yīng)的三維坐標。
3 車速計算
在已知的圖像序列中,假設(shè)連續(xù)幀中的目標車輛做勻速直線運動[4?5]。通過勻速直線運動方程s = vt + s0 計算目標車輛瞬時速度,利用最小二乘法原理可以很大程度上減小隨機誤差。當有多組(s,t)數(shù)據(jù)時,可以組成方程組,如式(4)所示:
式中:v 為車輛瞬時速度;ti 為連續(xù)n 幀對應(yīng)的時間(即n/幀頻);si 為車輛所在的實際位置。
轉(zhuǎn)換為矩陣形式為:
式(5)是一個(n × 2) × (2 × 1) = (n × 1) 的矩陣等式,記為AX = b 。
由式(6)可以求出X,得到車輛瞬時速度v。
4 實驗結(jié)果
通過標定后,可以獲得原圖像序列對應(yīng)的逆投影圖,將逆投影圖二值化后求車尾陰影位置進行目標車輛的檢測與跟蹤。圖2為同一目標車輛的連續(xù)幀處理過程。在該序列圖中檢測并跟蹤目標車輛。將檢測到的車尾位置在原逆投影圖中標注,如圖3所示。車尾在逆投影圖中的像素行轉(zhuǎn)化為實際三維距離后可得si ,幀間時間間隔ti 為40 ms(幀頻為25 Hz),可以得到如表1所示的對應(yīng)關(guān)系。由式(6)可以解出車輛瞬時速度為50.55 km/h。
5 結(jié)語
在交通領(lǐng)域中利用計算機視覺,通過圖像處理技術(shù)進行交通信息的檢測。建立基于攝像機的透視投影關(guān)系,可以標定出三維世界坐標與二維圖像坐標的對應(yīng)關(guān)系,從而獲得三維逆投影圖,進行車輛目標的跟蹤,計算得到車輛速度信息。通過大量實驗研究表明,該方法可以準確計算得到車輛速度,具有較好的穩(wěn)定性和可靠性,在當今智能交通領(lǐng)域具有一定的應(yīng)用前景。
參考文獻
[1] 馬頌德,張正友.計算機視覺:計算理論與算法基礎(chǔ)[M].北京:科學(xué)出版社,1998.
[2] HE Xiaochen,YUNG N H C. A novel algorithm for estimating vehicle speed from two consecutive images [C]// IEEE Work?shop on Applications of Computer Vision. [S.l.]:IEEE,2007:111?120.
[3] 宋俊芳.基于視頻的車流量檢測統(tǒng)計技術(shù)研究[D].西安:長安大學(xué),2010.
[4] 馬慧明.車速檢測技術(shù)述評[J].中北大學(xué)學(xué)報:自然科學(xué)版,2007(z1):139?144.
[5] 童劍軍,鄒明福.基于監(jiān)控視頻圖像的車輛測速[J].中國圖象圖形學(xué)報:A輯,2005,10(2):192?196.
關(guān)鍵詞:運動目標識別;背景差分法;瞬時差分法;OpenCV
中圖分類號:TP273
0 引 言
運動目標的識別就是對包含運動信息的視頻序列運用適當?shù)募夹g(shù)進行處理,把與背景存在相對運動的前景區(qū)分開的過程。它是計算機視覺信息提取中的一個重要問題,也是更高層次視頻分析,如基于對象的視頻編碼、目標跟蹤、運動分析基礎(chǔ)。目前,運動目標識別主要有三種方法:背景差分法、瞬時差分法和光流法。背景差分法可以得到比較完整的運動目標信息,但是背景模型的獲取和更新比較困難。瞬時差分法容易在目標內(nèi)部產(chǎn)生空洞,不能得到完整的目標信息。光流法計算比較復(fù)雜,且抗噪性能差,如果沒有特定的硬件支持,一般很難用于運動目標識別的實時性操作。
在此介紹一種將背景差分法和瞬時差分法相結(jié)合的運動目標識別算法,并給出基于OpenCV實現(xiàn)算法的過程和實驗結(jié)果。
1 算法思想
背景差分法是利用當前圖像與背景圖像的差分來識別出運動目標的方法。背景模型的獲取和更新是該方法中的關(guān)鍵技術(shù)。一種簡單的獲取背景圖像的方法是當場景中無任何目標出現(xiàn)時捕獲背景圖像,這種人工的非自適應(yīng)方法獲取的背景圖像僅適用于短時間內(nèi)的視頻監(jiān)控。目前大多數(shù)算法已經(jīng)放棄這種非自適應(yīng)的背景圖像估計方法。當場景環(huán)境不是很復(fù)雜時,可以使用統(tǒng)計濾波完成場景中背景圖像的估計,大多數(shù)情況下都可以得到正確的背景估計圖像,但是當場景中有個別部分做無規(guī)則運動時,會引起場景中像素值不斷變化,從而引起估計誤差。基于高斯統(tǒng)計模型的背景估計方法在有部分區(qū)域不斷變化的場景中也能比較準確地估計出背景模型,但是它的計算比較復(fù)雜,加上識別過程中其他操作也可能無法滿足實時性需求。
瞬時差分法是在視頻序列中兩個相鄰幀間采用基于像素的時間差分,并且閾值化來提取出運動目標的方法。即將相鄰的兩幀圖像做逐像素相減運算,并設(shè)定閾值,若相減的值大于閾值,則將其看作前景圖像(運動目標);否則看作是背景圖像。瞬時差分法對于動態(tài)環(huán)境的適應(yīng)性較強,不需要獲取背景圖像。當相鄰兩幀圖像的紋理、灰度等信息比較接近時,這種方法通常不能完整地檢測到目標的具體內(nèi)容,在物體內(nèi)部產(chǎn)生空洞。但是它可以較準確地得到運動物體的輪廓。
在此將使用一種背景差分法和瞬時差分法相結(jié)合的方法。首先根據(jù)一定數(shù)量的視頻序列,采用基于高斯統(tǒng)計模型的方法獲得背景圖像。在后續(xù)處理中,對于每一幀的視頻圖像,首先用瞬時差分法識別出運動目標的輪廓,然后用這幀圖像運動目標輪廓以外的區(qū)域?qū)Ρ尘澳P瓦M行基于統(tǒng)計濾波的更新。這樣就可以減少場景中運動目標對更新背景模型的影響,同時保證了系統(tǒng)運行時間的實時性,也可以得到較完整的目標識別信息。
2 算法實現(xiàn)
根據(jù)前文的算法思想,可以得到系統(tǒng)的流程圖如┩1所示。
開放源代碼的計算機視覺類庫OpenCV(Open Source Computer Vision Library)是由英特爾公司位于俄羅斯的研究實驗室所開發(fā)的一套可免費獲得,并由┮恍┆C函數(shù)和C++類所組成的庫,用來實現(xiàn)一些常用的圖像處理及計算機視覺算法[7[CD*2]10]。下面給出利用OpenCV實現(xiàn)算法的具體過程和關(guān)鍵部分的代碼:
(1) 捕獲視頻幀
定義捕捉源:
(2) 基于高斯統(tǒng)計估計背景模型
定義高斯背景模型:
將高斯背景模型的背景圖像復(fù)制到事先定義的背景圖像pBkImg 中:
(3) 使用瞬時差分法獲得不包含運動區(qū)域的當前幀,并更新背景。當前幀pFrame和前一幀pFrame0做差分,結(jié)果放在差分圖像diff中,并二值化:
接下來要做的操作是,找到差分圖像中的輪廓,得到他們的外接矩形。將面積小的矩形視為噪音拋棄,剩下的則視為運動目標。同時設(shè)置當前幀pFrame和背景pBkImg的ROI為運動目標的外接矩形。先將當前幀的ROI置0,再對當前幀與背景的ROI進行邏輯(or)運算。這樣,對于運動目標所在區(qū)域,當前幀和背景的圖像信息是一樣的,也就達到了消除運動目標對背景更新的影響目的。
這段代碼如下所示:
用上述過程得到不包含運動目標信息的當前幀更新背景模型:
(4) 進行背景差分,得到當前幀運動目標識別結(jié)果的二值圖像pFrImg:
3 實驗結(jié)果
根據(jù)上述算法思想和實現(xiàn)過程,使用VC++6.0和OpenCV 1.0實現(xiàn)運動目標的識別。經(jīng)過計算,該算法處理每一幀圖像的時間大約是16 ms,可以滿足實時性系統(tǒng)的要求。使用該算法對一段交通監(jiān)控圖像進行運動目標的識別,結(jié)果如圖2所示。其中,圖2(a)是當前幀圖像,圖2(b)是不包含運動信息的當前幀圖像,用矩形框標注出了由幀間差分檢測到運動目標的位置,┩2(c)是當前的背景模型,圖2(d)是背景差分的結(jié)果。オ
4 結(jié) 語
由上述實驗結(jié)果可以看出,本文介紹的算法可以較準確地得到背景圖像,并且實現(xiàn)運動目標的識別。
系統(tǒng)尚需改進的地方有對運動目標邊緣的檢測不夠清楚;如果可以加入陰影的檢測和去除,應(yīng)該會取得[LL]更好的識別效果。這些將是進一步研究的工作。
參 考 文 獻
[1]劉雪.基于圖像序列的運動目標檢測與跟蹤算法研究[D].山東:山東大學(xué),2007.
[2]許志良,周智恒,曹英烈,等.關(guān)于運動目標檢測的發(fā)展現(xiàn)狀研究[J].移動通信,2008(6):35[CD*2]38.
[3]丁忠校.視頻監(jiān)控圖像的運動目標檢測方法綜述[J].電視技術(shù),2008,32(5):72[CD*2]76.
[4]尹彥,耿兆豐.基于背景模型的運動目標檢測與跟蹤[J].微計算機信息,2008,24(11):298[CD*2]300.
[5]趙占杰,林小竹,張金燕.基于背景重建的運動目標檢測算法[J].北京石油化工學(xué)院學(xué)報,2008,16(2):27[CD*2]30.
[6]肖麗軍,于哲舟,周栩,等.基于對稱差分算法的視頻運動目標分割[J].吉林大學(xué)學(xué)報:理學(xué)版,2008,46(4):691[CD*2]696.
[7]賈小軍,喻擎蒼.基于開源計算機視覺處理庫OpenCV的圖像處理[J].計算機應(yīng)用與軟件,2008,25(4):276[CD*2]278.
[8]馬桂珍,朱玲贊,段麗.基于OpenCV的視頻應(yīng)用程序的開發(fā)方法[J].現(xiàn)代電子技術(shù),2007,30(4):78[CD*2]80.
[9]李振偉,陳,趙有.基于OpenCV的運動目標跟蹤及其實現(xiàn)[J].現(xiàn)代電子技術(shù),2008,31(20):128[CD*2]131.
[10]劉瑞禎,于仕琪.OpenCV教程基礎(chǔ)篇[M].北京:北京航空航天大學(xué)出版社,2007.