- LM Head Weights(语言模型头部权重):左侧的“LM Head Weights”表示语言模型头部的权重矩阵,它是模型参数的一部分。权重矩阵与输入数据进行运算。
- Logits(未归一化对数概率):经过与LM Head Weights运算后得到Logits。Logits是模型输出的未经过归一化处理的数值,代表各个类别(token )的得分。
- SM Agg(Softmax Aggregation) :对Logits进行特定的聚合处理,可能是为了在特定维度上进行汇总或进一步处理。
- Logits Softmax:将经过SM Agg处理后的Logits通过Softmax函数进行处理。Softmax函数将未归一化的Logits转换为概率分布,使得所有可能输出的概率之和为1。
- 输出:最终输出各个类别(这里用A、B、C表示不同token )对应的概率值,比如图中展示了多个类别,模型根据概率来预测最可能的输出。