之前的文章提供了批量识别pdf中英文的方法,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文上。以及自动pdf英文转中文文档,详见【python爬虫】批量识别pdf中的英文,自动翻译成中文下。
   
 本文实现python统计pdf中英文字符的个数。
文章目录
- 
   
- 一、要统计字符的pdf文档
 - 二、识别pdf中的字符
 - 三、定义统计单页pdf中字符个数的函数
 - 四、统计pdf中字符的个数
 
 
一、要统计字符的pdf文档
  
 首先看下要统计字符的pdf长什么样。

为了简单、清晰,本文以统计两页英文pdf字符为例进行阐述,代码直接可以应用到任意页数的英文pdf中。
  
   
二、识别pdf中的字符
  
 接着应用pdfplumber库识别pdf中的字符,具体代码如下:



![[uni-app] iOS/Android端 禁止单个页面侧滑返回的处理记录](https://img-blog.csdnimg.cn/316ddc95c3924bb7974291aa8b4fd3cd.png)















