Opencv(一)-图像的基础操作

学习目标

  • 获取像素值并修改

  • 获取图像的属性

  • 图像的ROI

  • 图像通道的拆分及合并

    几乎所有这些操作与 Numpy 的关系都比与 OpenCV 的关系更加紧密,因此熟练 Numpy 可以帮助我们写出性能更好的代码。

    获取并修改像素值

    1、首先我们需要读入一幅图像:

    1
    2
    3
    import cv2
    import numpy as np
    img=cv2.imread('C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg')

    注:cv2.imread():读入图片,共两个参数,第一个参数为要读入的图片文件名,第二个参数为如何读取图片,包括cv2.IMREAD_COLOR:读入一副彩色图片;cv2.IMREAD_GRAYSCALE:以灰度模式读入图片;cv2.IMREAD_UNCHANGED:读入一幅图片,并包括其alpha通道。

    注意:若文件名为中文,应使用如下方法打开文件:

    1
    2
    3
    4
    import cv2
    import numpy as np

    img = cv2.imdecode(np.fromfile('刘德华.jpg', dtype=np.uint8), -1)

    2、你可以根据像素的行和列的坐标获取他的像素值。对 BGR 图像而言,返回值为 B,G,R 的值。对灰度图像而言,会返回他的灰度值(亮度?intensity)

    1
    2
    3
    4
    5
    6
    7
    import cv2
    import numpy as np
    img=cv2.imread('C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg')
    px=img[100,100]
    print(px)
    blue=img[100,100,0]
    print(blue)

    运行结果为:

    1
    2
    [171 179 178]
    171

    其中‘0’表示第一个像素值。

    3、可以以类似方式修改像素值:

    1
    2
    3
    4
    5
    6
    7
      import cv2
    import numpy as np
    img=cv2.imread('C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg')
    img[100,100]=[255,255,255]
    print(img[100,100])

    ## [255 255 255]

    获取图像属性

    ​ 图像的属性包括:行,列,通道,图像数据类型,像素数目等img.shape 可以获取图像的形状。他的返回值是一个包含行数,列数,通道数的元组。

    1
    2
    3
    4
    5
    6
    import cv2
    import numpy as np
    img=cv2.imread('C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg')
    print(img.shape)

    ##(342, 548, 3)

    注意:如果图像是灰度图,返回值仅有行数和列数。所以通过检查这个返回值就可以知道加载的是灰度图还是彩色图。img.size 可以返回图像的像素数目:

    1
    2
    3
    4
    5
    6
    import cv2
    import numpy as np
    img = cv2.imread("C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg")
    print(img.size, img.dtype)

    ##583443 uint8

    图像ROI

    ​ 有时你需要对一幅图像的特定区域进行操作。例如我们要检测一副图像中眼睛的位置,我们首先应该在图像中找到脸,再在脸的区域中找眼睛,而不是直接在一幅图像中搜索。这样会提高程序的准确性和性能。
    ​ ROI 也是使用 Numpy 索引来获得的。现在我们选择球的部分并把他拷贝到图像的其他区域。

    ROI(region of interest),感兴趣区域。机器视觉、图像处理中,从被处理的图像以方框、圆、椭圆、不规则多边形等方式勾勒出需要处理的区域,称为感兴趣区域,ROI。在Halcon、OpenCV、Matlab等机器视觉软件上常用到各种算子(Operator)和函数来求得感兴趣区域ROI,并进行图像的下一步处理。

    1
    2
    3
    4
    5
    6
    7
      import cv2
    import numpy as np
    img = cv2.imread("C:\\Users\\Administrator\\Pictures\\Camera Roll\\7.png")
    ball = img[280:340,330:390]
    img[273:333,100:160]=ball
    img=cv2.imshow('test', img)
    cv2.waitKey(0)

结果如下:

GQ1iSs.png

拆分及合并图像通道

有时我们需要对 BGR 三个通道分别进行操作。这是你就需要把 BGR 拆分成单个通道。有时你需要把独立通道的图片合并成一个 BGR 图像。你可以这样做:

1
2
3
4
5
  import cv2
import numpy as np
img=cv2.imread('C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg')
b,g,r=cv2.split(img)
img=cv2.merge(b,g,r)

假如你想使所有像素的红色通道值都为 0,你不必先拆分再赋值。你可以直接使用 Numpy 索引,这会更快。

1
2
3
4
import cv2
import numpy as np
img=cv2.imread('C:\\Users\\Administrator\\Pictures\\Camera Roll\\6.jpg')
img[:,:,2]=0