龙空技术网

使用OpenCv和Dlib进行打哈欠检测

林小婵的店 992

前言:

现时咱们对“opencv dlib有什么区别”都比较看重,各位老铁们都需要知道一些“opencv dlib有什么区别”的相关内容。那么小编在网络上搜集了一些对于“opencv dlib有什么区别””的相关知识,希望我们能喜欢,看官们快快来了解一下吧!

OpenCV: OpenCV是一个用于计算机视觉的库函数,最初是用c++编写的。

Dlib: Dlib是一个Python库,包含了数据挖掘、数据结构、机器学习、图像处理等工具。

打哈欠检测与应用

打哈欠检测就是使用OpenCV和Dlib来检测打哈欠(由于疲劳或无聊而张大嘴巴深吸气)。可广泛应用于自驾车、驾驶员疲劳检测、驾驶员睡意检测、驾驶员意识检测等领域。

安装OpenCv和Dlib库

OpenCv的安装如下:

pip install opencv-python

Dlib的安装如下:

pip install cmakepip install dlib
导入Opencv,Dlib和Numpy库
import cv2import dlibimport numpy as np
设置dat文件
PREDICTOR_PATH = "shape_predictor_68_face_landmarks.dat"predictor = dlib.shape_predictor(PREDICTOR_PATH)#cascade_path='haarcascade_frontalface_default.xml#cascade = cv2.CascadeClassifier(cascade_path)detector = dlib.get_frontal_face_detector()

我们将.dat文件放置到工作目录中,它是一个可以识别面部特征并提供信息的模型。Dlib将从文件中提取所有信息,使用opencv查找不同的特征。

定义函数获取landmarks并使用颜色对其进行注释

def geting_landmarks(im):    rects = detector(im, 1)    if len(rects) > 1:        return "error"    if len(rects) == 0:         return "error",    return np.matrix([[p.x, p.y] for p in predictor(im, rects[0]).parts()])        def annotate_landmarks(im, landmarks):    im = im.copy()    for idx, point in enumerate(landmarks):        pos = (point[0, 0], point[0, 1])        cv2.putText(im, str(idx), pos,                    fontFace=cv2.FONT_HERSHEY_SCRIPT_SIMPLEX,                    fontScale=0.4,                    color=(1, 2, 255))        cv2.circle(im, pos, 3, color=(0, 2, 2))        return im

形状预测器(dat文件)用于从图像中提取信息,例如眼角,鼻子周围的区域等。图像被转换为​​矩阵,并且annotate_landmarks()函数标记这些特征/信息,其他函数使用这些特征/信息来提取各种像上嘴唇,上嘴等

提取有关各种特征的关键信息,以检测打哈欠

def top_lip(landmarks):    top_lip_pts = []    for i in range(50,53):        top_lip_pts.append(landmarks[i])    for i in range(61,64):        top_lip_pts.append(landmarks[i])    top_lip_all_pts = np.squeeze(np.asarray(top_lip_pts))    top_lip_mean = np.mean(top_lip_pts, axis=0)    return int(top_lip_mean[:,1])def bottom_lip(landmarks):    bottom_lip_pts = []    for i in range(65,68):        bottom_lip_pts.append(landmarks[i])    for i in range(56,59):        bottom_lip_pts.append(landmarks[i])    bottom_lip_all_pts = np.squeeze(np.asarray(bottom_lip_pts))    bottom_lip_mean = np.mean(bottom_lip_pts, axis=0)    return int(bottom_lip_mean[:,1])def mouth_open(image):    landmarks = geting_landmarks(image)        if landmarks == "error":        return image, 0        image_with_landmarks = annotate_landmarks(image, landmarks)    top_lip_center = top_lip(landmarks)    bottom_lip_center = bottom_lip(landmarks)    lip_distance = abs(top_lip_center - bottom_lip_center)    return image_with_landmarks, lip_distance

当yawn_status为True时,打开摄像头并定义打哈欠标准,然后相应地分配操作。Python实现如下:

cap = cv2.VideoCapture(0)yawns = 0yawn_status = False while True:    ret, frame = cap.read()       image_landmarks, lip_distance = mouth_open(frame)        prev_yawn_status = yawn_status          if lip_distance > 25:        yawn_status = True                 cv2.putText(frame, "Employee is Yawning", (50,450),                     cv2.FONT_HERSHEY_COMPLEX, 1,(0,0,255),2)                from pygame import mixer        mixer.init()        mixer.music.load('Yawn.mp3')        mixer.music.play()        output_text = " Yawn Count: " + str(yawns + 1)        cv2.putText(frame, output_text, (50,50),                    cv2.FONT_HERSHEY_COMPLEX, 1,(0,255,127),2)            else:        yawn_status = False              if prev_yawn_status == True and yawn_status == False:        yawns += 1    cv2.imshow('Live Landmarks', image_landmarks )    cv2.imshow('Yawn Detection', frame )        if cv2.waitKey(1) == 13:        break        cap.release()cv2.destroyAllWindows() 

如果lip_distance大于25,则(yawn_status)被定义为打呵欠。在这种情况下,屏幕上会出现“Employee is Yawning”的文字,然后我们播放mp3文件。如果Yawn_status为true,则“Yawn Count”将继续显示该对象打哈欠的次数。

实时显示Landmark如下所示

标签: #opencv dlib有什么区别