本文使用基于python和opencv模块的机器视觉处理方法

基本模块使用:

import cv2 #opencv读取的默认图片格式为BGR格式
import numpy as np#图像的本质是矩阵,彩色图片三维矩阵,灰度图是二维矩阵,此模块操作矩阵
import matplotlib.pyplot as plt#Matplotlib是RGB,绘图模块

img=cv2.imread('cat.jpg')#使用opencv读取一张猫的图片
img_gray = cv2.cvtColor(img,cv2.COLOR_BGR2GRAY)#读取的图片转化为灰度图BGR to GRAY
img_gray.shape#显示图片的长宽大小和矩阵维度

对于BGR图像,若想转为HSV图像,可以使用如下函数:

hsv=cv2.cvtColor(img,cv2.COLOR_BGR2HSV)#BGR to HSV

HSV:
H - 色调(主波长)。
S - 饱和度(纯度/颜色的阴影)。
V值(强度)

图片显示:

cv2.imshow("img_gray", img_gray)#imshow('窗口名字',欲显示图片)
cv2.waitKey(0)   #等待时间,0表示一直持续,任意键销毁
cv2.destroyAllWindows() #销毁

在显示上,通过def定义一个显示函数来方便调用:

def cv_show(name,img):
    cv2.imshow(name,img) 
    cv2.waitKey(0) 
    cv2.destroyAllWindows()

图像的二值化:

使用如下函数进行图像的二值化

ret, dst = cv2.threshold(src, thresh, maxval, type)
  • src: 输入图,只能输入单通道图像,通常来说为灰度图
  • dst: 输出图
  • thresh: 阈值,通常来说,灰度图阀值为0-255
  • maxval: 当像素值超过了阈值(或者小于阈值,根据type来决定),所赋予的值,也就是超出部分全部设置为这个值
  • type:二值化操作的类型,包含以下5种类型: cv2.THRESH_BINARY; cv2.THRESH_BINARY_INV; cv2.THRESH_TRUNC; cv2.THRESH_TOZERO;cv2.THRESH_TOZERO_INV
  • cv2.THRESH_BINARY           超过阈值部分取maxval(最大值),否则取0
  • cv2.THRESH_BINARY_INV    THRESH_BINARY的反转
  • cv2.THRESH_TRUNC            大于阈值部分设为阈值,否则不变
  • cv2.THRESH_TOZERO          大于阈值部分不改变,否则设为0
  • cv2.THRESH_TOZERO_INV  THRESH_TOZERO的反转