基于OpenCV的人脸微笑检测实现

news2025/5/16 13:24:32

文章目录

    • 引言
    • 一、技术原理
    • 二、代码实现
      • 2.1 关键代码解析
        • 2.1.1 模型加载
        • 2.1.2 图像翻转
        • 2.1.3 人脸检测 + 微笑检测
      • 2.2 显示效果
    • 三、参数调优建议
    • 四、总结

引言

在计算机视觉领域,人脸检测表情识别一直是热门的研究方向。今天我将分享一个使用Python和OpenCV实现的实时人脸微笑检测系统。这个系统能够通过摄像头捕捉视频流,实时检测人脸并识别微笑表情,非常适合初学者学习计算机视觉的基础应用。

一、技术原理

本实现主要基于OpenCV提供的Haar级联分类器,使用了两个预训练模型:

  1. haarcascade_frontalface_default.xml - 用于人脸检测
  2. haarcascade_smile.xml - 用于微笑检测

Haar级联分类器是一种基于机器学习的物体检测方法,由Paul Viola和Michael Jones在2001年提出。它通过训练大量正负样本,学习物体的特征模式,从而实现快速检测。

二、代码实现

import cv2

# 加载预训练模型
faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile = cv2.CascadeClassifier("haarcascade_smile.xml")
cap = cv2.VideoCapture('smile.mp4') #初始化摄像头

while True:     #处理每一帧
    ret,image = cap.read()   #读取一帧
    image = cv2.flip(image,1)    #图片翻转,水平翻转(镜像)
    
    # 没有读到,直接退出
    if ret is None:
        break
    
    # 转换为灰度图像
    gray = cv2.cvtColor(image,cv2.COLOR_BGR2GRAY)

    # 人脸检测
    faces = faceCascade.detectMultiScale(gray, 
                                         scaleFactor=1.1,
                                         minNeighbors=15,
                                         minSize=(5,5) )
    
    # 处理每个人脸
    for (x,y,w,h) in faces:
        cv2.rectangle(image,(x,y),(x + w,y + h),(0,255,0),2)
        
        # 提取人脸ROI区域(灰度)
        roi_gray_face = gray[y:y+h,x:x+w]
        cv2.imshow('Face ROI',roi_gray_face)
        
        # 微笑检测,仅在人脸区域内检测
        smiles = smile.detectMultiScale(roi_gray_face,
                                        scaleFactor=1.5,
                                        minNeighbors=2,
                                        minSize=(50,50))
        
        for (sx,sy,sw,sh) in smiles:
            # 绘制微笑区域
            a = x + sx
            b = y + sy
            cv2.rectangle(image,(a,b),(a+sw,b+sh),(255,0,0),2)
            # 显示"smile"文字
            cv2.putText(image,"smile",(x,y),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,
                        (0,255,255),thickness=2)
    
    # 显示结果
    cv2.imshow("Smile Detection",image)
    key = cv2.waitKey(25)
    if key ==27:  # ESC键退出
        break

# 释放资源
cap.release()
cv2.destroyAllWindows()

2.1 关键代码解析

2.1.1 模型加载
faceCascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
smile = cv2.CascadeClassifier("haarcascade_smile.xml")

这两行代码加载了OpenCV提供的预训练Haar级联分类器模型。


2.1.2 图像翻转
image = cv2.flip(image, 1)
  1. cv2.flip()函数

    • 作用:翻转输入图像(水平、垂直或同时翻转)。
    • 参数:
      • 第1个参数 image:输入的图像(NumPy数组)。
      • 第2个参数 1:翻转模式的标志。
        • 0:垂直翻转(沿x轴翻转)。
        • 1:水平翻转(沿y轴翻转,即镜像效果)。
        • -1:同时水平和垂直翻转。
  2. flipCode=1 的效果
    假设原图为:

			原图:    [A B C]   → 翻转后: [C B A]
          			 [D E F]             [F E D]
  • 每一行的元素顺序被反转,但行的顺序不变。

2.1.3 人脸检测 + 微笑检测
for (x,y,w,h) in faces:
        cv2.rectangle(image,(x,y),(x + w,y + h),(0,255,0),2)
        # 提取人脸所在区域,多通道形式
        # roiColorFace = image(y:y+h,x:x+w)
        # 提取人脸所在区域,单通道形式
        roi_gray_face = gray[y:y+h,x:x+w]
        cv2.imshow('lian',roi_gray_face)
        # 微笑检测,仅在人脸区域内检测
        smiles = smile.detectMultiScale(roi_gray_face,
                                        scaleFactor=1.5,
                                        minNeighbors=2,
                                        minSize=(50,50))
        for (sx,sy,sw,sh) in smiles:
            # 绘制微笑区域
            a = x + sx
            b = y + sy
            cv2.rectangle(image,(a,b),(a+sw,b+sh),(255,0,0),2)
            # 显示文字“smile” 表示微笑了
            cv2.putText(image,"smile",(x,y),cv2.FONT_HERSHEY_COMPLEX_SMALL,1,
                        (0,255,255),thickness=2)

这段代码是一个 人脸检测 + 微笑检测 的程序,主要使用了 OpenCV 的 Haar 级联分类器(detectMultiScale)来检测人脸和微笑。以下是详细解析:


代码功能概述

  1. 检测人脸(在 faces 中存储的人脸矩形框)。
  2. 提取人脸区域(灰度图 roi_gray_face)。
  3. 在人脸区域内检测微笑smiles)。
  4. 绘制人脸框和微笑框,并标注文字“smile”。

代码逐行解析

1. 遍历检测到的人脸

for (x, y, w, h) in faces:
  • faces 是一个包含人脸矩形框的列表,每个框由 (x, y, w, h) 表示:
    • (x, y):人脸左上角坐标。
    • (w, h):人脸的宽度和高度。

2. 绘制人脸矩形框

cv2.rectangle(image, (x, y), (x + w, y + h), (0, 255, 0), 2)
  • 在原始图像 image 上绘制绿色矩形框(RGB (0,255,0)),线宽为 2

3. 提取人脸区域(灰度图)

roi_gray_face = gray[y:y+h, x:x+w]
cv2.imshow('lian', roi_gray_face)
  • gray 是灰度图像(单通道)。
  • roi_gray_face 是从 gray 中截取的人脸区域。
  • cv2.imshow('lian', roi_gray_face) 显示人脸区域的灰度图(窗口名 'lian')。

4. 在人脸区域内检测微笑

smiles = smile.detectMultiScale(
    roi_gray_face,
    scaleFactor=1.5,
    minNeighbors=2,
    minSize=(50, 50)
)
  • smile 是一个训练好的 Haar 级联分类器(用于微笑检测)。
  • 参数说明
    • scaleFactor=1.5:每次图像缩放的比例(越大检测越快,但可能漏检)。
    • minNeighbors=2:候选框至少需要多少个邻近检测才被确认(越小误检越多)。
    • minSize=(50, 50):微笑区域的最小尺寸(小于该尺寸的忽略)。

5. 遍历检测到的微笑区域

for (sx, sy, sw, sh) in smiles:
  • smiles 包含微笑矩形框 (sx, sy, sw, sh),坐标是相对于 roi_gray_face(人脸区域)的。

6. 绘制微笑框(蓝色)

a = x + sx  # 转换到原始图像的坐标
b = y + sy
cv2.rectangle(image, (a, b), (a + sw, b + sh), (255, 0, 0), 2)
  • (a, b) 是微笑框在原始图像 image 中的左上角坐标。
  • 绘制蓝色矩形框(RGB (255,0,0)),线宽 2

7. 标注文字“smile”

cv2.putText(image, "smile", (x, y), cv2.FONT_HERSHEY_COMPLEX_SMALL, 1, (0, 255, 255), 2)
  • 在人脸框左上角 (x, y) 处显示黄色文字“smile”:
    • 字体:cv2.FONT_HERSHEY_COMPLEX_SMALL
    • 字号:1
    • 颜色:(0, 255, 255)(黄色)。
    • 线宽:2

代码执行流程

  1. 输入图像 → 检测人脸 → 绘制绿色人脸框。
  2. 提取人脸区域 → 检测微笑 → 绘制蓝色微笑框。
  3. 标注“smile”文字 → 显示结果。

注意事项

  1. 依赖 Haar 级联分类器
    • facessmiles 是由 cv2.CascadeClassifier 检测得到的。
    • 通常需要加载预训练模型:
      face_cascade = cv2.CascadeClassifier('haarcascade_frontalface_default.xml')
      smile_cascade = cv2.CascadeClassifier('haarcascade_smile.xml')
      
  2. 参数调优
    • scaleFactorminNeighbors 影响检测精度和速度,需根据实际场景调整。
  3. 坐标转换
    • 微笑检测是在人脸区域 (roi_gray_face) 内进行的,绘制时需要转换回原始图像坐标。

2.2 显示效果

    # 显示结果
    cv2.imshow("dect",image)
    key = cv2.waitKey(25)
    if key ==27:
        break
cap.release()
cv2.destroyAllWindows()
  • 显示效果如下,我们插入一段视频,在视频中对人物进行微笑检测,并画出检测框:

在这里插入图片描述

三、参数调优建议

  1. 人脸检测参数

    • minNeighbors值越大,检测越严格,但可能漏检
    • scaleFactor通常在1.01-1.5之间
  2. 微笑检测参数

    • 由于微笑区域相对较小,minSize不宜设置过大
    • minNeighbors可以适当调小以避免漏检

四、总结

本文介绍了一个基于OpenCV Haar级联分类器的实时微笑检测系统。虽然Haar级联分类器在复杂场景下可能表现不佳,但它的计算效率高,非常适合初学者学习和快速原型开发。通过调整参数和优化流程,可以在实际应用中获得不错的效果。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2376882.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

2025-5-15Vue3快速上手

1、setup和选项式API之间的关系 (1)vue2中的data,methods可以与vue3的setup共存 (2)vue2中的data可以用this读取setup中的数据,但是反过来不行,因为setup中的this是undefined (3)不建议vue2和vue3的语法混用…

【金仓数据库征文】从生产车间到数据中枢:金仓数据库助力MES系统国产化升级之路

目录 前言一、金仓数据库:国产数据库的中坚力量二、制造业MES系统:数据驱动的生产智能MES系统的核心价值MES系统关键模块与数据库的关系1. BOM管理2. 生产工单与订单管理3. 生产排产与资源调度4. 生产报工与实时数据采集 5. 采购与销售管理 三、从MySQL到…

HTML17:表单初级验证

表单初级验证 常用方式 placeholder 提示信息 <p>名字:<input type"text" name"username" maxlength"8" size"30" placeholder"请输入用户名"></p>required 非空判断 <p>名字:<input type"…

从卡顿到丝滑:JavaScript性能优化实战秘籍

引言 在当今的 Web 开发领域&#xff0c;JavaScript 作为前端开发的核心语言&#xff0c;其性能表现对网页的加载速度、交互响应以及用户体验有着举足轻重的影响。随着 Web 应用的复杂度不断攀升&#xff0c;功能日益丰富&#xff0c;用户对于网页性能的期望也越来越高。从电商…

ORB特征点检测算法

角点是图像中灰度变化在两个方向上都比较剧烈的点。与边缘&#xff08;只有一个方向变化剧烈&#xff09;或平坦区域&#xff08;灰度变化很小&#xff09;不同&#xff0c;角点具有方向性和稳定性。 tips:像素梯度计算 ORB算法流程简述 1.关键点检测&#xff08;使用FAST…

快速通关单链表秘籍

1.单链表概念与结构 1.1 概念 链表是一种逻辑结构连续&#xff0c;物理结构不连续的存储结构&#xff0c;数据结构的逻辑顺序是通过链表中的指针链接次序实现。 光看定义有点不好理解&#xff0c;我们举个简单例子&#xff01; 我们都看过火车吧&#xff0c;我们看到的火车…

springboot+vue实现在线书店(图书商城)系统

今天教大家如何设计一个图书商城 , 基于目前主流的技术&#xff1a;前端vue&#xff0c;后端springboot。 同时还带来的项目的部署教程。 视频演示 在线书城 图片演示 一. 系统概述 商城是一款比较庞大的系统&#xff0c;需要有商品中心&#xff0c;库存中心&#xff0c;订单…

Spring AI(6)——向量存储

向量数据库是一种特殊类型的数据库&#xff0c;在 AI 应用中发挥着至关重要的作用。 在向量数据库中&#xff0c;查询与传统关系型数据库不同。它们执行的是相似性搜索&#xff0c;而非精确匹配。当给定一个向量作为查询时&#xff0c;向量数据库会返回与该查询向量“相似”的…

【Matlab】最新版2025a发布,深色模式、Copilot编程助手上线!

文章目录 一、软件安装1.1 系统配置要求1.2 安装 二、新版功能探索2.1 界面图标和深色主题2.2 MATLAB Copilot AI助手2.3 绘图区升级2.4 simulink2.5 更多 延迟一个月&#xff0c;终于发布了&#x1f92d;。 一、软件安装 1.1 系统配置要求 现在的电脑都没问题&#xff0c;老…

uniapp,小程序中实现文本“展开/收起“功能的最佳实践

文章目录 示例需求分析实现思路代码实现1. HTML结构2. 数据管理3. 展开/收起逻辑4. CSS样式 优化技巧1. 性能优化2. 防止事件冒泡3. 列表更新处理 实际效果总结 在移动端应用开发中&#xff0c;文本内容的"展开/收起"功能是提升用户体验的常见设计。当列表项中包含大…

思维链框架:LLMChain,OpenAI,PromptTemplate

什么是思维链,怎么实现 目录 什么是思维链,怎么实现思维链(Chain of Thought)在代码中的实现方式1. 手动构建思维链提示2. 少样本思维链提示3. 自动思维链生成4. 思维链与工具使用结合5. 使用现有思维链框架:LLMChain,OpenAI,PromptTemplate思维链实现的关键要点思维链(C…

使用 QGIS 插件 OpenTopography DEM Downloader 下载高程数据(申请key教程)

使用 QGIS 插件 OpenTopography DEM Downloader 下载高程数据 目录 使用 QGIS 插件 OpenTopography DEM Downloader 下载高程数据&#x1f4cc; 简介&#x1f6e0; 插件安装方法&#x1f30d; 下载 DEM 数据步骤&#x1f511; 注册 OpenTopography 账号&#xff08;如使用 Cope…

计算机组成与体系结构:替换策略(MRU LRU PLRU LFU)

目录 &#x1f3b2; MRU&#xff08;最近最常使用&#xff09; &#x1fa9c; 操作流程&#xff1a; &#x1f3b2; LRU&#xff08;最近最少使用&#xff09; &#x1fa9c; 操作流程&#xff1a; 示例 &#x1f50d; Age Bits&#xff08;年龄位&#xff09; 核心思想…

websocket入门详解

入门websocket的基础应该掌握一下问题&#xff1a; 1、什么是握手&#xff1f; 2、什么是websocket&#xff1f; 3、websocket和http的区别&#xff0c;应用场景 4、html前端简单代码演示 5、springboot整合websocket使用 6、使用vueelementui打造简单聊天室 7、使用web…

(6)python开发经验

文章目录 1 QListWidget样式显示异常2 模块编码错误3 qtcreator开发pyqt编码错误 更多精彩内容&#x1f449;内容导航 &#x1f448;&#x1f449;Qt开发 &#x1f448;&#x1f449;python开发 &#x1f448; 1 QListWidget样式显示异常 main.py import sys from PySide6.QtWi…

HPC软件使用之ANSYS Fluent

目录 一、软件介绍 二、脚本编写 2.1 jou文件 2.2 slurm脚本文件 三、作业提交及查看 四、案例演示 4.1 网格模型 4.2 jou脚本 4.3 slurm脚本 4.4 计算 4.5 结果查看 从本文开始&#xff0c;我们将介绍如何在超级计算机上使用科学计算、工程仿真计算软件开展计算&am…

YOLO11解决方案之距离计算探索

概述 Ultralytics提供了一系列的解决方案&#xff0c;利用YOLO11解决现实世界的问题&#xff0c;包括物体计数、模糊处理、热力图、安防系统、速度估计、物体追踪等多个方面的应用。 测量两个物体之间的间距被称为特定空间内的距离计算&#xff0c;YOLO11使用两个边界框的中心…

论文学习_Precise and Accurate Patch Presence Test for Binaries

摘要&#xff1a;打补丁是应对软件漏洞的主要手段&#xff0c;及时将补丁应用到所有受影响的软件上至关重要&#xff0c;然而这一点在实际中常常难以做到&#xff0c;研究背景。因此&#xff0c;准确检测安全补丁是否已被集成进软件发行版本的能力&#xff0c;对于防御者和攻击…

Ascend的aclgraph(九)AclConcreteGraph:e2e执行aclgraph

1回顾 前面的几章内容探讨了aclgraph运行过程中的涉及到的关键模块和技术。本章节将前面涉及到的模块串联起来&#xff0c;对aclgraph形成一个端到端的了解。 先给出端到端运行的代码&#xff0c;如下&#xff1a; import torch import torch_npu import torchair import log…

c++从入门到精通(四)--动态内存,模板与泛型编程

文章目录 动态内存直接管理内存Shared_ptr类Unique_ptrWeak_ptr动态数组allocator类文本查询程序 模板与泛型编程定义模板函数模板类模板模板参数成员模板控制实例化 模板实参推断重载与模板可变参数模板模板特例化 动态内存 c中动态内存的管理是通过new和delete运算符来实现的…