使用OpenCV 和 Dlib 进行卷积神经网络人脸检测

news2025/5/9 22:56:43

文章目录

  • 引言
  • 1.准备工作
  • 2.代码解析
    • 2.1 导入必要的库
    • 2.2 加载CNN人脸检测模型
    • 2.3 加载并预处理图像
    • 2.4 进行人脸检测
    • 2.5 绘制检测结果
    • 2.6 显示结果
  • 3.完整代码
  • 4.性能考虑
  • 5.总结

引言

人脸检测是计算机视觉中最基础也最重要的任务之一。今天我将分享如何使用dlib库中的CNN人脸检测器和OpenCV来实现一个简单但高效的人脸检测程序。

1.准备工作

首先,我们需要安装必要的Python库:

pip install dlib opencv-python

此外,你还需要下载dlib提供的CNN人脸检测模型文件"mmod_human_face_detector.dat",可以从下面链接中获取。

  • mmod_human_face_detector.dat

2.代码解析

让我们逐步分析这个人脸检测程序的每个部分:

2.1 导入必要的库

import dlib
import cv2
  • dlib:一个强大的机器学习库,包含优秀的人脸检测和识别算法
  • cv2:OpenCV库,用于图像处理和显示

2.2 加载CNN人脸检测模型

cnn_face_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")

这里我们使用dlib提供的CNN人脸检测器,它基于Max-Margin Object Detection (MMOD)算法,相比传统的HOG特征方法,CNN方法在复杂场景下表现更好。

2.3 加载并预处理图像

img = cv2.imread("hezhao.jpg")
img = cv2.resize(img,dsize=None,fx=0.5,fy=0.5)
  • 使用OpenCV读取图像文件
  • 将图像尺寸缩小一半,加快处理速度(可根据需要调整缩放比例)

2.4 进行人脸检测

faces = cnn_face_detector(img,0) # 检测人脸

调用CNN人脸检测器,返回检测到的人脸列表。参数0表示不进行上采样,保持原图尺寸检测。

2.5 绘制检测结果

for d in faces:
    # 计算每个人脸的位置
    rect = d.rect
    left = rect.left()
    top = rect.top()
    right = rect.right()
    bottom = rect.bottom()
    # 绘制人脸对应的矩形框
    cv2.rectangle(img,(left,top),(right,bottom),(0,255,0),3)

遍历所有检测到的人脸,获取其边界框坐标,并用绿色矩形框标记出来。

2.6 显示结果

cv2.imshow("result",img)
k = cv2.waitKey()
cv2.destroyAllWindows()

使用OpenCV显示处理后的图像,等待用户按键后关闭窗口。

显示结果如下所示:
在这里插入图片描述

3.完整代码

import dlib
import cv2
cnn_face_detector = dlib.cnn_face_detection_model_v1("mmod_human_face_detector.dat")
img = cv2.imread("hezhao.jpg")
img = cv2.resize(img,dsize=None,fx=0.5,fy=0.5)

faces = cnn_face_detector(img,0) # 检测人脸

for d in faces:
    # 计算每个人脸的位置
    rect = d.rect
    left = rect.left()
    top = rect.top()
    right = rect.right()
    bottom = rect.bottom()
    # 绘制人脸对应的矩形框
    cv2.rectangle(img,(left,top),(right,bottom),(0,255,0),3)
cv2.imshow("result",img)
k = cv2.waitKey()
cv2.destroyAllWindows()

4.性能考虑

  1. 模型选择:dlib提供了两种人脸检测器 - HOG(histogram of oriented gradients)和CNN。CNN模型更准确但计算量更大。

  2. 图像缩放:对大尺寸图像进行适当缩小可以显著提高处理速度。

  3. 硬件加速:如果有GPU支持,CNN模型可以运行得更快。

5.总结

通过这个简单的示例,我们展示了如何使用dlib和OpenCV实现一个有效的人脸检测系统。虽然代码只有不到20行,但它包含了计算机视觉中人脸检测的核心流程。你可以基于此代码进一步开发更复杂的人脸相关应用。

慢也好,步子小也好,往前走就好,只要我们一步步前进,都为时不晚。加油!
🚀🚀🚀

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2371847.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

React 实现 JWT 登录验证的最小可运行示例

下面是一个用 React 实现 JWT 登录验证的最小可运行示例,包含: React 前端:登录、保存 Token、获取用户数据。模拟后端:用 mock API(你也可以接真后端)。 🧱 技术栈 React(使用 Vi…

Power Query精通指南1:查询结构设计、数据类型、数据导入与迁移(平面文件、Excel、Web)

文章目录 零、Power Query简介0.1 Power Query 主要功能0.2 Power Query 的优势0.3 Power Query 组件 一、Power Query数据处理基本流程1.1 前期准备1.2 提取1.3 转换1.3.1 Power Query 编辑器界面1.3.2 默认转换1.3.3 自定义转换 1.4 加载1.4.1 自动检测数据类型1.4.2 重命名查…

vue2开发者sass预处理注意

vue2开发者sass预处理注意 sass的预处理器,早年使用node-sass,也就是vue2最初默认的编译器。 sass官方推出了dart-sass来替代。 node-sass已经停维很久了。 vue3默认使用的是dart-sass。 Uniapp的官方文档截图 从 HBuilderX 4.56 ,vue2 …

使用 Selenium 爬取动态网页数据 —— 实战与坑点详解

本文记录了笔者在爬取网页数据过程中遇到的各种技术挑战,包括页面动态渲染、JavaScript 注入等问题,并最终给出一个可运行的完整方案。 文章目录 网页获取不到数据🚀 尝试用 Selenium 渲染页面 网页获取不到数据 某网页数据依赖大量 JavaSc…

守护数字家园:个人博客安全防护指南

前言 在之前的文章《WordPress个人博客搭建(一)》《WordPress个人博客搭建(二)》《WordPress个人博客搭建(三)》中,我们已经在非凡云云服务器上,借助1Panel搭建起属于自己的数字庭院…

【网络编程】三、TCP网络套接字编程

文章目录 TCP通信流程Ⅰ. 服务器日志类实现Ⅱ. TCP服务端1、服务器创建流程2、创建套接字 -- socket3、绑定服务器 -- bind🎏4、服务器监听 -- listen🎏5、获取客户端连接请求 -- acceptaccept函数返回的套接字描述符是什么,不是已经有一个了…

trae ai编程工具

Trae,致力于成为真正的 AI 工程师(The Real Al Engineer)。Trae 旗下的 AI IDE 产品,以智能生产力为核心,无缝融入你的开发流程,与你默契配合,更高质量、高效率完成每一个任务。 版本差异 国内…

神经网络发展历程——积跬步至千里

神经网络类型层线性or非线性创新问题备注感知器单层线性模型,输出 1 1 1, − 1 -1 −1误差反馈学习阈值函数不可导,构造学习规则与感知器准则等价线性神经元单层线性模型梯度下降法训练参数线性函数,多层仍是线性变换本质上是最小…

荣耀A8互动娱乐组件部署实录(第2部分:界面逻辑与资源加载机制)

作者:从 Spine 骨骼动画里抠图三小时没睡的美术兼前端苦工 一、界面整体架构拆解 荣耀A8组件采用的是典型的分模块 UI 架构,即:主界面为入口容器,不同子页面(如商城、银行、客服、游戏入口)以逻辑功能划分…

mac 使用 Docker 安装向量数据库Milvus独立版的保姆级别教程

Milvus 特点:开源的云原生向量数据库,支持多种索引类型和GPU加速,能够在亿级向量规模下实现低延迟高吞吐。具有灵活的部署选项和强大的社区支持。 适用场景:适合处理超大规模数据和高性能需求的应用,如图像搜索、推荐…

技术视界 | 青龙机器人训练地形详解(一):如何创建一个地形

机器人强化学习中的地形训练是利用强化学习算法让机器人在不同地形环境中通过试错学习最优行为策略的过程,通过环境建模、策略学习与优化等环节,使机器人能够自主适应复杂多变的地形,提高其移动效率、稳定性和自主性,减少人为干预…

2025-05-04 Unity 网络基础6——TCP心跳消息

文章目录 1 Disconnect 方法2 心跳消息 ​ 在客户端主动退出时,我们会调用 socket 的 ShutDown() 和 Close() 方法,但调用这两个方法后,服务器端无法得知客户端已经主动断开。 ​ 本文主要介绍在网络通信中,如何服务端如何判断客…

word导出pdf带有目录导航栏-error记

1、打开word文档——>点击"视图"选项卡——>勾选"导航窗格" 2、点击"文件"——>导出——>创建PDF/XPS 3、点击"选项"——>勾选"创建书签时使用(C)" "标题(H)" 4、点击"确定"——>点击…

1. 视频基础知识

1. 图像基础概念 像素:像素是一个图片的基本单位,pix是英语单词picture,加上英语单词“元素element”,就得到了pixel,简称px。所以“像素”有“图像元素”之意。分辨率:指的是图像的大小或者尺寸。比如 19…

HarmonyOS-hdc远程网络方式连接设备

hdc工具使用手册 1 hdc简介 hdc(OpenHarmony Device Connector)是为开发人员提供的用于设备连接调试的命令行工具,pc端开发机使用命令行工具hdc,该工具需支持部署在Windows/Linux/Mac等系统上与OpenHarmony设备(或模…

奥威BI:AI+BI深度融合,重塑智能AI数据分析新标杆

在数字化浪潮席卷全球的今天,企业正面临着前所未有的数据挑战与机遇。如何高效、精准地挖掘数据价值,已成为推动业务增长、提升竞争力的核心议题。奥威BI,作为智能AI数据分析领域的领军者,凭借其创新的AIBI融合模式,正…

第三节第一部分:Static修饰类变量、成员变量

总结 案例 要求 代码: User类: package com.day1_static;public class User {public static int num;public User() {User.num;} }Test类: package com.day1_static;public class Test {public static void main(String[] args) {User us…

高级架构软考之网络OSI网络模型

高级架构软考之网络: 1.OSI网络模型: a.物理层: a.物理传输介质物理连接,负责数据传输,并监控数据 b.传输单位:bit c.协议: d:对应设备:中继器、集线器 b.数据链路层: a.…

Kubernetes(k8s)学习笔记(六)--KubeSphere前置环境安装

1、安装 helm(master 节点执行) Helm 是 Kubernetes 的包管理器。包管理器类似于我们在 Ubuntu 中使用的apt、Centos 中使用的 yum 或者 Python 中的 pip 一样,能快速查找、下载和安装软件包。Helm由客户端组件 helm 和服务端组件 Tiller 组…

架构思维:构建高并发读服务_异构数据的同步一致性方案

文章目录 一、引言二、全景架构回顾三、潜在问题问题1:Binlog 延迟——理想 vs 实际问题2:Binlog 格式解析问题3:高可靠消费1. 串行 ACK 消费2. 并行消费+乱序风险3. 解决方案 问题4:缓存数据结构设计1. Key–Value 冗…