Python OpenCV 針對(duì)圖像細(xì)節(jié)的不同操作技巧
本系列專欄寫(xiě)作將采用首創(chuàng)的問(wèn)答式寫(xiě)作形式,快速讓你學(xué)習(xí)到 OpenCV 的初級(jí)、中級(jí)、高級(jí)知識(shí)。
6. 在 Python OpenCV 針對(duì)圖像細(xì)節(jié)的不同操作本篇博客的目標(biāo)將為你解釋一幅圖像的拆解,包括圖像像素的說(shuō)明,圖像屬性信息的獲取與修改,圖像目標(biāo)區(qū)域 ROI 相關(guān)內(nèi)容,以及圖像通道的知識(shí)(包括拆分通道和合并通道)
這些內(nèi)容在知識(shí)結(jié)構(gòu)上與 numpy 庫(kù)十分緊密,如果從學(xué)習(xí)的角度出發(fā),建議你儲(chǔ)備一下 numpy 相關(guān)知識(shí)。
讀取修改圖像的像素值在之前的博客中,我們已經(jīng)學(xué)到了如何讀取一幅圖像,使用 cv2.imread 函數(shù)即可,并且掌握了該函數(shù)的兩個(gè)關(guān)鍵參數(shù)。
讀取圖片之后,我們可以直接使用操作數(shù)組的方式獲取圖像任意位置的顏色,一般這個(gè)顏色的默認(rèn)順序是 BGR。
測(cè)試代碼如下:
import cv2import matplotlib.pyplot as pltsrc = cv2.imread('./6_test.jpg')# 獲取 100 x 100 位置的像素值print(src[100, 100])cv2.imshow('src', src)cv2.waitKey()
這里首先獲取 100 x 100 位置的像素值。src[100,100]會(huì)獲取到三個(gè)值,分別對(duì)應(yīng)的 BGR 通道的值。我們?cè)趫D片上標(biāo)記一個(gè)像素點(diǎn),rows = 250,cols=470 ,接下來(lái)修改上述代碼,看獲取到的 BGR 值。
import cv2import matplotlib.pyplot as pltsrc = cv2.imread('./6_test.jpg')# 注意獲取像素值的格式為 [cols,rows]print(src[250, 470])cv2.imshow('src', src)cv2.waitKey()
上文特別注意的就是,獲取像素值的格式為 [cols,rows],列在前,行在后。
以上獲取到的是 BGR 值,也可以只獲取單個(gè)通道的值,對(duì)應(yīng)的代碼是 [cols,rows,channel],對(duì)應(yīng)到代碼部分,如下所示:
# 獲取藍(lán)色通道值print(src[250, 470, 0])
藍(lán)色通道對(duì)應(yīng) 0,綠色通道為 1,紅色通道為 2,超出以上三個(gè)值,就會(huì)出現(xiàn)如下錯(cuò)誤:
IndexError: index 3 is out of bounds for axis 2 with size 3
當(dāng)前如果你直接讀取了灰度圖,例如下述代碼,三個(gè)通道的值是相同的。
import cv2import matplotlib.pyplot as pltsrc = cv2.imread('./6_test.jpg', 0)# 注意獲取像素值的格式為 [cols,rows]print(src[250, 470])cv2.imshow('src', src)cv2.waitKey()
這個(gè)地方還有一個(gè)編碼上存在的潛在問(wèn)題,如果讀取的是四通道圖片,即圖片有透明度,那數(shù)組的索引值可以讀取到 3,也就是下述代碼是正確的。
import cv2import matplotlib.pyplot as pltsrc = cv2.imread('./test.jpg', -1)# 注意獲取像素值的格式為 [cols,rows]print(src[250, 470, 3])cv2.imshow('src', src)cv2.waitKey()
src[250, 470, 3] 成功讀取到了透明通道的值。
我們可以針對(duì)特定的像素點(diǎn)進(jìn)行值的修改,例如下述代碼
import cv2import matplotlib.pyplot as pltsrc = cv2.imread('./6_test.jpg')# 注意獲取像素值的格式為 [cols,rows]src[250, 470] = [255, 255, 255]cv2.imshow('src', src)cv2.waitKey()
注意下圖的紅色箭頭指向的位置,出現(xiàn)一個(gè)白色亮點(diǎn),使用該辦法,可以制造出一個(gè)【椒鹽圖片】。
這個(gè)地方需要注意的一個(gè)潛在 BUG,讀取圖片的通道數(shù),決定了你復(fù)制時(shí)數(shù)組元素個(gè)數(shù),例如下述代碼將會(huì)報(bào)錯(cuò)。
import cv2import matplotlib.pyplot as pltsrc = cv2.imread('./6_test.jpg')# 注意獲取像素值的格式為 [cols,rows]src[250, 470] = [255, 255, 255, 255]cv2.imshow('src', src)cv2.waitKey()
錯(cuò)誤信息都是類(lèi)似的,提示數(shù)組維度不同。
ValueError: cannot copy sequence with size 4 to array axis with dimension 3
最后一點(diǎn)使用以上方式操作圖像的像素點(diǎn),非常耗時(shí),因?yàn)橐粡垐D片的像素點(diǎn)數(shù)據(jù)是非常大的,一般情況下能用 numpy 集成好的方法,就不要用這種最笨拙的方式。
使用 numpy 獲取通道值,注意該方式獲取的是標(biāo)量,如果你想獲得所有 BGR 的值,你需要使用 array.item() 依次獲取。
import cv2import numpy as npsrc = cv2.imread('./6_test.jpg')print(src[100, 100])b = src.item(100, 100, 0)g = src.item(100, 100, 1)r = src.item(100, 100, 2)print(b, g, r)cv2.imshow('src', src)cv2.waitKey()
如果希望設(shè)置該值,直接使用 itemset 函數(shù)即可。
src.itemset((100, 100, 0), 200)print(src[100, 100])
可以任意尋找一張圖片進(jìn)行對(duì)應(yīng)的測(cè)試,運(yùn)行效果如下:
[ 31 68 118]31 68 118[200 68 118]
OpenCV 中圖像屬性常見(jiàn)問(wèn)題解析對(duì)于一幅圖像,除了像素矩陣以外,還有一個(gè)非常重要的內(nèi)容,是圖像的屬性,這些包括行、列、通道、數(shù)據(jù)類(lèi)型,像素?cái)?shù)量、圖像形狀等內(nèi)容。
例如,我們經(jīng)常使用 img.shape 去獲取圖像的形狀,尤其注意的是,返回的內(nèi)容是行數(shù)(rows),列數(shù)(cols),以及通道數(shù)(channels),并且返回值類(lèi)型是一個(gè)元組。
如果你讀取圖像的時(shí)候,設(shè)置緊讀取灰度圖,那只會(huì)返回行數(shù)和列數(shù),相應(yīng)的通過(guò)這個(gè)值很容易能判斷出你加載的圖像類(lèi)型。
例如下述代碼,通過(guò)不同的方式讀取同一張圖片,輸出圖像的不同形狀。
import cv2import numpy as np# 選擇一個(gè) jpg 圖片,可以讀取到不同的通道src1 = cv2.imread('./test.jpg', -1)src2 = cv2.imread('./test.jpg', 0)src3 = cv2.imread('./test.jpg')# 四通道,包含透明通道print(src1.shape)# 灰度圖print(src2.shape)# 三通道print(src3.shape)
輸出結(jié)果可以快速的讀取出圖像是彩色圖像還是灰度圖像。
(397, 595, 4)(397, 595)(397, 595, 3)
使用 img.size 可以快速返回圖像中像素的合計(jì)數(shù)目,測(cè)試代碼如下:
# 選擇一個(gè) jpg 圖片,可以讀取到不同的通道src1 = cv2.imread('./test.jpg', -1)src2 = cv2.imread('./test.jpg', 0)src3 = cv2.imread('./test.jpg')# 四通道,包含透明通道print(src1.shape)print(src1.size)# 灰度圖print(src2.shape)print(src2.size)# 三通道print(src3.shape)print(src3.size)
我們依舊三種不同的讀取方式,讀取到的像素?cái)?shù)分別如下:
(397, 595, 4)944860(397, 595)236215(397, 595, 3)708645
注意,灰度圖像和彩色圖像的像素?cái)?shù)不同,它們之前存在如下關(guān)系。
灰度圖像的像素?cái)?shù) = 行數(shù) x 列數(shù) = 397 x 595 = 236215
彩色圖像的像素?cái)?shù) = 行數(shù) x 列數(shù) x 通道數(shù) = 944860 (四通道)/ 708645(三通道)
使用 img.dtype 屬性可以獲取到圖像的類(lèi)型,具體如下:
print(src1.dtype)
這里讀取到的值,都是相同的 uint8 表示 8 位圖像,這里可以記住只要是 uint8 格式,那對(duì)應(yīng)的 BGR 值的范圍就是在 [0,255] 之間。
在操作上述屬性值的時(shí)候,會(huì)出現(xiàn)如下 BUG,該 BUG 的通用解決方案是排查圖片是否正常讀取,需要特別注意下:
AttributeError: ’NoneType’ object has no attribute ’shape’
print(src1.dtype)
這里讀取到的值,都是相同的 uint8 表示 8 位圖像,這里可以記住只要是 uint8 格式,那對(duì)應(yīng)的 BGR 值的范圍就是在 [0,255] 之間。
在操作上述屬性值的時(shí)候,會(huì)出現(xiàn)如下 BUG,該 BUG 的通用解決方案是排查圖片是否正常讀取,需要特別注意下:
AttributeError: ’NoneType’ object has no attribute ’shape’
到此這篇關(guān)于Python OpenCV 針對(duì)圖像細(xì)節(jié)的不同操作的文章就介紹到這了,更多相關(guān)Python OpenCV圖像內(nèi)容請(qǐng)搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!
相關(guān)文章:
1. CSS hack用法案例詳解2. 利用promise及參數(shù)解構(gòu)封裝ajax請(qǐng)求的方法3. JSP數(shù)據(jù)交互實(shí)現(xiàn)過(guò)程解析4. asp(vbs)Rs.Open和Conn.Execute的詳解和區(qū)別及&H0001的說(shuō)明5. ASP 信息提示函數(shù)并作返回或者轉(zhuǎn)向6. Ajax實(shí)現(xiàn)表格中信息不刷新頁(yè)面進(jìn)行更新數(shù)據(jù)7. PHP設(shè)計(jì)模式中工廠模式深入詳解8. 解決AJAX返回狀態(tài)200沒(méi)有調(diào)用success的問(wèn)題9. .NET中l(wèi)ambda表達(dá)式合并問(wèn)題及解決方法10. ThinkPHP5實(shí)現(xiàn)JWT Token認(rèn)證的過(guò)程(親測(cè)可用)
