PPOCR车牌定位模型推理后处理优化研究

news2025/7/27 12:39:46

综述

最近在研究基于PPOCR算法的车牌识别(LPR),部署模型后发现之前关于OCR文本定位的后处理策略在车牌识别中存在定位精度不够高,文本框偏移的问题,如:
定位偏移1
定位偏移2
经分析发现是之前的OCR后处理策略存在一定局限:即获取最小外接矩形难以应对侧拍导致的车牌形状平行四边形化和梯形化问题。需要优化这一后处理策略。

改进策略

经过我一段时间的调研、代码研究与测试,需要对这一策略做如下改进:

1、修改车牌定位模型推理提取文本区域概率图轮廓提取算法中的method以保证轮廓点的连续性:CHAIN_APPROX_SIMPLE->CHAIN_APPROX_NONE
2、在进行一次轮廓点最小外接矩形提取后,以提取到的最小外接矩形上下两边的中心点和宽高乘以一个权重,来构造两个新的外接矩形,并且要保证分别把上下两边附近的大部分轮廓点包含进来,但是一个矩形区域不能同时包含上下两边的轮廓点
3、针对第一次轮廓点最小外接矩形进行一次多边形加权扩张与重新外接矩形调整,记录新的外接矩形左右两侧顶点坐标,以最小二乘法算法求取上一步中构造的两个矩形区域内所有点的拟合直线,并记录拟合直线的斜率值
4、根据上一步求取的上下两边斜率值来估算文本区域两侧边哪一边为长边,哪一边为短边,取长边一侧的对应顶点坐标和上下两边拟合直线的斜率构造两条新的直线,且该直线须经过较长侧边的一个顶点
5、将较短侧边线以二维像素坐标系直线的方式表示出来,求取该直线与上一步构造的两条直线的交点,作为短侧边新的顶点坐标,将短侧边的两个顶点坐标与之前长侧边两个顶点的坐标组成一组新的定位框坐标
6、根据车牌位置、拍摄角度与成像的特点,车牌左右两端边线大多数情况下是竖直方向的,所以在保持左右两边边长不变的情况下以左右两边中点为轴分别旋转左右两边,使其竖直化,并同步变更定位坐标

以上修改方案是基于原有后处理策略基础上来制定的,关于原有处理策略的介绍可以看我的另一篇文章安卓端部署PPOCR的ncnn模型——模型部署

为了便于大家理解这一改进策略,我以实例图像来进行说明:
假设我们需要对以下车牌图进行车牌定位:
示例图
1、车牌定位模型推理提取文本区域概率图(如下图的白色区域)
车牌文本信息定位概率图
2、提取概率图轮廓和最小外接矩形(如下图的蓝色线条和红色线条)
轮廓和最小外接矩形
3、新的旋转矩形构造与直线拟合
转矩形构造与直线拟合
4、获取原始策略下的矩形标注框位置
原始标注框
5、计算更新策略下的矩形标注框位置
更新标注框

效果评价

经自测试定位精度有了明显提升,同时也为之后的车牌字符识别打下良好基础,无论是定位框位置精度还是校正图的正方向性都有了明显的改善,稍后我会将代码分享出来。

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/35308.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

java刷题day 03

选择题: 解析: 父类private的成员变量,根据权限修饰符的访问控制范围,只有在类内部才能被访问,就算是他的子类,也不能访问。这里如果将Person p new Child();改成 Person p new Person();代码依然无法通过…

乐趣国学—品读《弟子规》中的“余力学文”之道

文章目录余力学文不力行 但学文 长浮华 成何人但力行 不学文 任己见 昧理真读书法 有三到 心眼口 信皆要方读此 勿慕彼 此未终 彼勿起宽为限 紧用功 工夫到 滞塞通心有疑 随札记 就人问 求确义房室清 墙壁净 几案洁 笔砚正墨磨偏 心不端 字不敬 心先病列典籍 有定处 读看毕 还原…

信号完整性测试,关于SMA装配的细节,很多人都忽视了

作者 | 萧隐君,仿真秀专栏作者 SMA转接头是射频微波、天线和高速电路测试经常用到的一种连接器,应用非常广泛,种类也很多。在信号完整性的测试夹具中,2.92mm的SMA用的较多,它的带宽可以到40GHz,对于25Gbps…

【全网独家,收藏吧】10年全部《信息资源管理》真题整理,第2章 信息化规划与组织

文章目录🔥 11 年 4 月《信息资源管理》真卷选择题名词解释综合分析题🔥 11 年 7 月《信息资源管理》真卷选择题名词解释题简答题⭐ 12 年 4 月《信息资源管理》真卷选择题简答题⭐ 12 年 7 月《信息资源管理》真卷选择题简答题⭐ 13 年 4 月《信息资源管…

计算机网络--- 电子邮件

(一)电子邮件系统的组成 电子邮件是一种异步通信方式,通信时不需要双方同时在场。电子邮件把邮件发送到收件人使用的邮件服务器,并放在其中的收件人邮箱中,收件人可以随时上网到自己使用的邮件服务器进行读取。 一…

补盲激光雷达大爆发,各路产品谁领风骚?

11月伊始车载激光雷达赛道上演了冰火两重天的景象。国外Ouster与Velodyne LiDAR宣布合并以抱团取暖,主打OPA技术的Quanergy甚至股市停牌,一时风声鹤唳,寒意阵阵;而反观国内,禾赛、速腾、亮道相继发布纯固态补盲激光雷达…

龙格-库塔法(Runge-Kutta methods)

非线性的常微分方程通常是难以求出解析解的,只能通过多次迭代求近似的数值解。 龙格-库塔法(Runge-Kutta methods)是用于非线性常微分方程的解的重要的一类隐式或显式迭代法。简写做RK法。 对于任意的Yf(X),假设某点(Xi,Yi)的斜…

固定资产管理系统能帮助企业解决哪些问题?

固定资产管理系统是企业信息化转型中重要的工具之一。固定资产在企业整体资金和运营管理中的占比非同一般,因此企业管理者对固定资产的重视程度也逐渐提升。随着企业固定资产数量和种类的增多、人员的增多,以及分支机构和部门的增多,单纯依靠…

数据安全治理白皮书4.0(附下载link)

数据安全治理白皮书是国内最早的数据安全治理白皮书系列,围绕数据安全治理,“新理论、新技术、新实践”,一次系统汇总、梳理分析与集中呈现,2018年-2021年,已发布1.0/2.0/3.0三个版本,2022年,已…

LeetCode | 循环队列的爱情【恋爱法则——环游世界】

兜兜转转⚪还是你❤✒前言环形队列的概念拓展:生产者与消费者一、题目描述二、思路分析🍑初次遇见她♀【是心动的感觉】🍑阻碍一:队空还是队满不好区分【性格互异】🍑解决方案🍑阻碍二:很难获取…

Git之借助Commitizen规范化提交代码

文章目录一、约定式提交规范1.1 概述1.2 规范1.3 好处二、Commitizen2.1 安装2.2 安装并配置cz-customizable依赖2.2.1 安装依赖2.2.2 配置package.json2.2.3 添加cz-config配置文件2.3 使用2.4 问题一、约定式提交规范 1.1 概述 约定式提交规范是一种基于提交信息的轻量级约…

ES6 入门教程 26 编程风格 26.4 对象 26.5 数组 26.6 函数

ES6 入门教程 ECMAScript 6 入门 作者:阮一峰 本文仅用于学习记录,不存在任何商业用途,如侵删 文章目录ES6 入门教程26 编程风格26.4 对象26.5 数组26.6 函数26 编程风格 26.4 对象 单行定义的对象,最后一个成员不以逗号结尾。多…

流媒体传输 - RTSP 协议

概述 协议简介 RTSP RTSP (Real-Time Stream Protocol) 实时流传输协议是一种基于文本的应用层协议,常被用于 建立的控制媒体流的传输,该协议用于 C/S 模型 , 是一个 基于文本 的协议,用于在客户端和服务器端建立和协商实时流会话。 RTP …

JS语句完全攻略

JavaScript 语言定义了 20 套(或个)语句命令,分别执行不同的操作。 以用途划分,JavaScript 语句可以分为:声明、分支控制、循环控制、流程控制异常处理和其他。 以结构划分,JavaScript 语句又可以分为单句…

【Python】基础知识(语句,函数)

目录Python基础语法接上次的知识点补充顺序语句条件/分支语句语法格式空语句 pass循环语句while 循环For循环continue和break函数语法格式调用函数/使用函数函数参数函数返回值变量作用域函数执行过程链式调用嵌套调用函数递归参数默认值关键字参数写在前面🍎&#…

全双工物联网远程控制门禁设计方案

远程控制物联网方案 (此方案成本250元~300元优点是远低于产家报价400~500,使用自家服务器扩展成本低) 组装后连线效果实物图 网关配置 工具见下面产品说明 通讯是TCP/IP协议,一定要配置好服务器地址与网关 通讯是TCP/IP协议,一定要配置好服务器地址与网关 通讯是TCP…

照片人像模糊怎么调?两分钟教会你

有时候我们在拍摄一些照片的时候,可能会因为一些特殊原因而导致照片中的人脸出现模糊的情况,从而使我们无法对照片进行浏览,这时最简单的方法就是借助一些软件来修复模糊的人脸照片,那你们知道如何利用这些软件进行操作吗&#xf…

机器视觉_HALCON_1.了解HALCON

文章目录HALCON概述1. 关于HALCON2. HALCON XL3. 了解HALCON3.1. 通用性说明3.2. 安装HALCON3.3. 继续了解HALCON的第一步4. 更多HALCON资料5. 结语HALCON概述 1. 关于HALCON HALCON是MVTec公司的一款软件产品。 它是一款风靡全球的、用于机器视觉的标准软件,并带…

React - Ant Design3.x版本安装使用,并按需引入和自定义主题

React - Ant Design3.x版本安装使用,并按需引入和自定义主题一. 安装使用 antd二.antd 高级配置安装 react-app-rewired,对 create-react-app 的默认配置进行自定义安装 babel-plugin-import ,按需加载组件代码和样式自定义主题An…

ssh外网访问内网服务器

现在有这样一个情况,实验室有自己的服务器(内网),并且有相关老师进行维护(公网),我们可以在内网用内网ip访问服务器,如果我们在家里只能通过公网进行登录。但是我在实验室有一个小服…