文章目录
- classification_report
 - 混淆矩阵
 - 精确率(精准率),召回率,F1值
 - 精确率
 - 召回率
 - F1值
 - 精确率、召回率和F1值的应用
 
- 参考文献
 
classification_report
假设使用sklearn.metrics.classification_report生成的分类图像如下图所示:
 
 列名:“精确率(precision)”、“召回率(recall)”、“F1值(f1-score)”、“样本数(support)”
 行名:“类别(0:错误;1:正确)”、“准确率(accuracy)”、“算术平均(macro avg)”、“加权平均(weighted avg)”
 weighted avg:本身的比例乘以该样本占全部样本的比例
  
      
       
        
        
          m 
         
        
          a 
         
        
          c 
         
        
          r 
         
        
          o 
         
        
            
         
        
          w 
         
        
          e 
         
        
          i 
         
        
          g 
         
        
          h 
         
        
          t 
         
        
          = 
         
        
          ( 
         
        
          0.9305 
         
        
          + 
         
        
          0.9474 
         
        
          ) 
         
        
          / 
         
        
          2 
         
        
          = 
         
        
          0.9389 
         
         
        
          w 
         
        
          e 
         
        
          i 
         
        
          g 
         
        
          h 
         
        
          t 
         
        
          e 
         
        
          d 
         
        
            
         
        
          a 
         
        
          v 
         
        
          g 
         
        
          = 
         
        
          0.9305 
         
        
          ∗ 
         
         
         
           7702 
          
          
          
            7702 
           
          
            + 
           
          
            10498 
           
          
         
        
          + 
         
        
          0.9474 
         
        
          ∗ 
         
         
         
           10498 
          
          
          
            10498 
           
          
            + 
           
          
            7702 
           
          
         
        
       
         macro\ weight=(0.9305+0.9474)/2=0.9389\\ weighted\ avg=0.9305*\frac{7702}{7702+10498}+0.9474*\frac{10498}{10498+7702} 
        
       
     macro weight=(0.9305+0.9474)/2=0.9389weighted avg=0.9305∗7702+104987702+0.9474∗10498+770210498
 想要理解什么是精确率、什么是召回率、什么是F1值,我们首先需要了解混淆矩阵
混淆矩阵
我们在这里定义行表示真实值,列表示预测值,如下图:
 
- 先填写阳性P和隐性N:阳性和隐性由预测值决定,凡是预测为1的都是阳性-P,凡是预测为0的都是隐性-N

 - 接着填写真T假F:真假由预测值是否跟真实值一致来决定。若一致,如副对角线上,则为T;若不一致,如主对角线上则为F

 
精确率(精准率),召回率,F1值
精确率
精确率:你认为是对的中,有多少是对的
 你认为对的中:即预测值为1的数量:TP+FP
 有多少是对的:TP
  
      
       
        
        
          P 
         
        
          r 
         
        
          e 
         
        
          c 
         
        
          i 
         
        
          s 
         
        
          i 
         
        
          o 
         
        
          n 
         
        
          = 
         
         
          
          
            T 
           
          
            P 
           
          
          
          
            T 
           
          
            P 
           
          
            + 
           
          
            F 
           
          
            P 
           
          
         
        
       
         Precision=\frac{TP}{TP+FP} 
        
       
     Precision=TP+FPTP
 精确率衡量了模型在预测正类别时的准确性
召回率
召回率:本来是对的中,你找回了多少对的
 本来是对的,即真实值为1的数量:TP+TN
 你找回了多少对的:TP
  
      
       
        
        
          R 
         
        
          e 
         
        
          c 
         
        
          a 
         
        
          l 
         
        
          l 
         
        
          = 
         
         
          
          
            T 
           
          
            P 
           
          
          
          
            T 
           
          
            P 
           
          
            + 
           
          
            T 
           
          
            N 
           
          
         
        
       
         Recall=\frac{TP}{TP+TN} 
        
       
     Recall=TP+TNTP
 召回率衡量模型找出正类别样本的能力
F1值
F1值:精确率越高越好,召回率越高越好
  
      
       
        
        
          F 
         
        
          1 
         
        
          = 
         
         
         
           2 
          
          
           
           
             1 
            
            
            
              P 
             
            
              r 
             
            
              e 
             
            
              c 
             
            
              i 
             
            
              s 
             
            
              i 
             
            
              o 
             
            
              n 
             
            
           
          
            + 
           
           
           
             1 
            
            
            
              R 
             
            
              e 
             
            
              c 
             
            
              a 
             
            
              l 
             
            
              l 
             
            
           
          
         
        
          ( 
         
        
          方便理解 
         
        
          ) 
         
        
       
         F1=\frac{2}{\frac{1}{Precision}+\frac{1}{Recall}}(方便理解) 
        
       
     F1=Precision1+Recall12(方便理解)
  
      
       
        
        
          F 
         
        
          1 
         
        
          = 
         
         
          
          
            2 
           
          
            P 
           
          
            r 
           
          
            e 
           
          
            c 
           
          
            i 
           
          
            s 
           
          
            i 
           
          
            o 
           
          
            n 
           
          
            ∗ 
           
          
            R 
           
          
            e 
           
          
            c 
           
          
            a 
           
          
            l 
           
          
            l 
           
          
          
          
            P 
           
          
            r 
           
          
            e 
           
          
            c 
           
          
            i 
           
          
            s 
           
          
            i 
           
          
            o 
           
          
            n 
           
          
            + 
           
          
            R 
           
          
            e 
           
          
            c 
           
          
            a 
           
          
            l 
           
          
            l 
           
          
         
        
          ( 
         
        
          标准公式 
         
        
          ) 
         
        
       
         F1=\frac{2Precision*Recall}{Precision+Recall}(标准公式) 
        
       
     F1=Precision+Recall2Precision∗Recall(标准公式)
 F1值综合考虑了模型的准确性和查全率
精确率、召回率和F1值的应用
- 医疗诊断:
癌症检测:在医疗图像分析中,精确率和召回率可以用来评估模型对癌症病灶的检测性能。高精确率可以减少误报,高召回率可以确保不错过患者的真正癌症病变 - 信息安全:
垃圾邮件过滤:在垃圾邮件过滤中,精确率和召回率用于评估模型对垃圾邮件的识别性能。高精确率可降低误将正常邮件分类为垃圾邮件的情况,高召回率可确保垃圾邮件不被漏过 - 搜索引擎:
信息检索:在搜索引擎中,精确率和召回率用于评估检索结果的质量。高精确率确保搜索结果与用户查询高度相关,高召回率确保不错过潜在相关结果 - 社交媒体分析:
情感分析:在社交媒体情感分析中,精确率和召回率用于评估模型对情感类别的分类性能。高精确率可减少误分类,高召回率可确保捕捉到各种情感表达 - 自然语言处理:
实体识别:在实体识别任务中,精确率和召回率可用于评估模型对命名实体的识别性能。高精确率可确保标识的实体准确,高召回率可确保找到尽可能多的实体 - 金融风险管理:
信用评分:在信用评分模型中,精确率和召回率可用于评估模型对高风险客户的识别性能。高精确率可减少风险,高召回率可确保不错过潜在风险 - 制造业质量控制:
产品质量检验:在制造业中,精确率和召回率可用于评估产品质量检验模型的性能。高精确率可减少误报次品,高召回率可确保检测到尽可能多的次品 
参考文献
1、classification_report分类报告
 2、自己画混淆矩阵,防止懵逼
 3、精确率(精准率),召回率,F1值的通俗解释



















