Python OpenCV實(shí)現(xiàn)視頻追蹤
本文實(shí)例為大家分享了Python OpenCV實(shí)現(xiàn)視頻追蹤的具體代碼,供大家參考,具體內(nèi)容如下
1. MeanShift假設(shè)有一堆點(diǎn)集和一個(gè)圓形的小窗口。現(xiàn)在需要將此窗口移動(dòng)到具有最高點(diǎn)集密度的區(qū)域,如下圖:
第一個(gè)窗口C1是藍(lán)色圓圈的區(qū)域。藍(lán)色環(huán)的中心用藍(lán)色矩形標(biāo)記并命名為 C1_o。窗口中所有點(diǎn)的點(diǎn)集形成的質(zhì)心在藍(lán)色圓形點(diǎn)C1_r。顯然,質(zhì)心和環(huán)的質(zhì)心不重合。移動(dòng)藍(lán)色窗口,使質(zhì)心與先前獲得的質(zhì)心重合。在新移動(dòng)的圓環(huán)的區(qū)域內(nèi)再次找到圓環(huán)包圍的點(diǎn)集的質(zhì)心,然后再次移動(dòng)。通常,形心和質(zhì)心不重合。繼續(xù)執(zhí)行上述移動(dòng)過(guò)程,直到形心與質(zhì)心大致重合。這樣,最終的圓形窗口就會(huì)落到像素分布最大的地方,也就是圖中的綠色圓圈C2。
除了用于視頻跟蹤之外,MeanShift算法在涉及數(shù)據(jù)和無(wú)監(jiān)督學(xué)習(xí)的各種場(chǎng)景中都有重要的應(yīng)用,例如聚類、平滑等。它是一種廣泛使用的算法。
圖像是信息矩陣。如何使用MeanShift算法跟蹤視頻中的移動(dòng)物體?一般流程如下:
1)在圖像上選擇一個(gè)目標(biāo)區(qū)域,
2)計(jì)算選中區(qū)域的直方圖分布,一般是HSV顏色空間的直方圖。
3)計(jì)算下一幀圖像 b 的直方圖分布。
4)計(jì)算圖像b中與所選區(qū)域的直方圖分布最相似的區(qū)域,并使用MeanShift算法將所選區(qū)域沿最相似的部分移動(dòng),直到找到最相似的區(qū)域。
5)重復(fù)3到4的過(guò)程,完成整個(gè)視頻目標(biāo)跟蹤。
一般情況下,我們使用直方圖反投影得到的圖像和目標(biāo)物體在第一幀的起始位置。當(dāng)目標(biāo)物體的運(yùn)動(dòng)會(huì)在直方圖反投影圖像中反映出來(lái)時(shí),MeanShift算法會(huì)將窗口移動(dòng)到反投影圖像中灰度密度最高的區(qū)域。
假設(shè)我們有一個(gè) 100x100 的輸入圖像和一個(gè) 10x10 的模板圖像,直方圖反投影的過(guò)程是這樣的:
1)從輸入圖像的左上角(0,0)開(kāi)始,從(0,0)到(10,10)剪切一張臨時(shí)圖像。
2)生成臨時(shí)圖像的直方圖。
3)將臨時(shí)圖像的直方圖與模板圖像的直方圖進(jìn)行比較,比較結(jié)果標(biāo)記為c。
4)直方圖比較結(jié)果c為結(jié)果圖像中(0,0)處的像素值。
5)將輸入圖像的臨時(shí)圖像從(0,1)剪切到(10,11),對(duì)比直方圖,記錄結(jié)果圖像。
6)重復(fù)步驟1到5,直到輸入圖像的右下角,形成直方圖的反投影。
cv.meanShift(probImage, window, criteria)
參數(shù):
probImage ROI區(qū)域,即目標(biāo)的直方圖的反向投影。
window 初始搜索窗口,就是定義ROI的rect。
criteria 確定窗口搜索停止的準(zhǔn)則,主要有迭代次數(shù)達(dá)到設(shè)置的最大值,窗口中心的漂移值大于某個(gè)設(shè)定的限值等。
2. CamShiftMeanShift的結(jié)果有一個(gè)問(wèn)題,檢測(cè)窗口的大小是固定的,而狗是一個(gè)由近到遠(yuǎn)逐漸變小的過(guò)程,固定的窗口是不合適的。 所以需要根據(jù)目標(biāo)的大小和角度來(lái)修正窗口的大小和角度。
CamShift(Continuously Adaptive Mean-Shift algorithm)是MeanShift算法的改進(jìn)算法,可以解決這個(gè)問(wèn)題。它可以隨著跟蹤目標(biāo)大小的變化實(shí)時(shí)調(diào)整搜索窗口的大小,具有更好的跟蹤效果。 Camshift 算法首先應(yīng)用MeanShift。 一旦MeanShift收斂,它就會(huì)更新窗口的大小,同時(shí)計(jì)算出最佳擬合橢圓的方向,從而根據(jù)目標(biāo)的位置和大小來(lái)更新搜索窗口。
例:使用MeanShift和CamShift方法獲取視頻中的狗,并標(biāo)注。
import cv2 as cvimport numpy as np # 獲取視頻cap = cv.VideoCapture(’image/DOG.wmv’) # 指定追蹤目標(biāo)ret, frame = cap.read()r, h, c, w = 197, 141, 0, 208win = (c, r, w, h)roi = frame[r:r + h, c:c + w] # 計(jì)算直方圖hsv_roi = cv.cvtColor(roi, cv.COLOR_BGR2HSV)roi_hist = cv.calcHist([hsv_roi], [0], None, [180], [0, 180])cv.normalize(roi_hist, roi_hist, 0, 255, cv.NORM_MINMAX) # 目標(biāo)追蹤term = (cv.TERM_CRITERIA_EPS | cv.TERM_CRITERIA_COUNT, 10, 1) # meanshiftwhile True: ret, frame = cap.read() if ret:hst = cv.cvtColor(frame, cv.COLOR_BGR2HSV)dst = cv.calcBackProject([hst], [0], roi_hist, [0, 180], 1) ret, win = cv.meanShift(dst, win, term) x, y, w, h = winimg2 = cv.rectangle(frame, (x, y), (x + w, y + h), 255, 2)cv.imshow('frame', img2)if cv.waitKey(60) & 0xFF == ord(’q’): break # camshiftwhile True: ret, frame = cap.read() if ret:hst = cv.cvtColor(frame, cv.COLOR_BGR2HSV)dst = cv.calcBackProject([hst], [0], roi_hist, [0, 180], 1) ret, track_window = cv.CamShift(dst, win, term) # 繪制追蹤結(jié)果pts = cv.boxPoints(ret)pts = np.int0(pts)img2 = cv.polylines(frame, [pts], True, 255, 2)cv.imshow('frame', img2)if cv.waitKey(60) & 0xFF == ord(’q’): break # 釋放資源cap.release()cv.destroyAllWindows()
以上就是本文的全部?jī)?nèi)容,希望對(duì)大家的學(xué)習(xí)有所幫助,也希望大家多多支持好吧啦網(wǎng)。
相關(guān)文章:
1. asp(vbs)Rs.Open和Conn.Execute的詳解和區(qū)別及&H0001的說(shuō)明2. CSS hack用法案例詳解3. ASP 處理JSON數(shù)據(jù)的實(shí)現(xiàn)代碼4. PHP設(shè)計(jì)模式中工廠模式深入詳解5. 用css截取字符的幾種方法詳解(css排版隱藏溢出文本)6. asp中response.write("中文")或者js中文亂碼問(wèn)題7. ASP.NET MVC遍歷驗(yàn)證ModelState的錯(cuò)誤信息8. ThinkPHP5實(shí)現(xiàn)JWT Token認(rèn)證的過(guò)程(親測(cè)可用)9. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向10. .Net Core和RabbitMQ限制循環(huán)消費(fèi)的方法
