NLP学习笔记五-simple RNN
我这个学习笔记,感兴趣的小伙伴,看的时候尽量从头开始看,这样更好理解,也更有收获。
 simple RNN的单元结构图如下:

 其中A就是我们需要学习的参数矩阵, 
     
      
       
        
        
          h 
         
         
         
           t 
          
         
           − 
          
         
           1 
          
         
        
       
      
        h_{t-1} 
       
      
    ht−1是我们上个单元得到的向量, 
     
      
       
        
        
          x 
         
        
          t 
         
        
       
      
        x_{t} 
       
      
    xt是当前单元输入的词向量,当前词向量 
     
      
       
        
        
          x 
         
        
          t 
         
        
       
      
        x_{t} 
       
      
    xt和h_{t-1} 
     
      
       
       
         拼接,之后和矩阵 
        
       
         A 
        
       
         相乘,在经过 
        
       
         t 
        
       
         a 
        
       
         n 
        
       
         h 
        
       
         的处理得到当前单元结构的输出 
        
        
        
          h 
         
        
          t 
         
        
       
      
        拼接,之后和矩阵A相乘,在经过tanh的处理得到当前单元结构的输出h_{t} 
       
      
    拼接,之后和矩阵A相乘,在经过tanh的处理得到当前单元结构的输出ht
那么下面我们讲完simple RNN,还需要将一些知识,simple RNN并不能直接得到什么,simple RNN其实也是相当于一个特征提取的模型,从词向量中提取最终相应的特征信息h,这就是simple RNN的作用,如果我们做的是预测或者分类任务,还需要加入一个全连接层对h进行处理。下面就是一个很典型的simple RNN的网络结构,当然在做simple RNN之前,我们也一定是做完了词向量表征的。

















