昨天太摸鱼啦~不过蛮开心的哈哈
今天主要是把积累的ddl都清理一下！！！第一项就是我和舍友一起读的论文嘿嘿！！

一、RAGA

（零）总结（仅模型）

作为数据挖掘顶会2021年的论文，感觉这篇文章比较干净简洁，读起来舒服，值得学习模仿。【emmm…是不是顶会也没那么难呀hhh】
由于过于缺少背景知识，而且要讲解这篇文章，所以在粗览后，进行顺序阅读。

(一)摘要&intro

—0847大致读了摘要和intro。

1、该文章主要想解决实体对齐的两个问题：

（1）难以利用多条边提供的信息

提出了Relation-aware GAN

（2）两个KG双向进行对齐时会产生矛盾

提出了deferred acceptance algorithm（延迟接受算法）
查了一下这个词，搜到了一篇Stanford2007年的论文，下载下来看看，有需要就看看~
“盖尔-沙普利算法（Gale-Shapley algorithm）简称 “GS算法”，也称为 “延迟接受算法”（deferred-acceptance algorithm），，是盖尔和沙普利为了寻找一个稳定匹配而设计出的市场机制。”
** 约会匹配算法**
参考链接：
https://blog.csdn.net/lc_miao/article/details/78114127
https://www.cnblogs.com/jesse123/p/6008595.html
https://zhuanlan.zhihu.com/p/356907926

2、开源代码

Link:
https://github.com/zhurboo/RAGA
去fork & clone一下好啦

—0914休息的时候报名了蓝桥（氪金）杯，还是报python组叭~虽然很想学学c++，但估计还是不会有时间叭
emmm要认证身份，还要等几天emm希望不要忘了

欸嘿，一天就通过了，快报名！！！

----0918继续看论文啦！！！

（二）模型

1、GCN

（1）Intuition

Every node defines a computation graph based on its neighborhood!

(2) Deep Model

A. nodes have embeddings at each layer
B. Layer-0 embedding of node v is its input feature, xv
C. Layer-k embedding gets information from nodes that are k hops away

(3)Neighborhood Aggregation

**KEY DISTINCTIONS:
how different approaches aggregate info across the layers

A. basic approach
(a) average
(b) apply nn
在这里插入图片描述

（4）Training model

将hv（最后的embedding）放入任何一个Loss function 学习Wk和Bk就好啦
其中Wk用来聚合neibors；Bk用来transform自己

（5）Matrix Formulation

矩阵形式表达transformation，这样就可以coding啦！
在这里插入图片描述

2、文中GCN model

查了一下与上述公式不同的原因。
“　　改进三：Symmetric normalization
　　上述归一化只考虑了聚合节点 𝑖 的度的情况，但没有考虑到邻居 𝑗 (其节点的情况)，即未对邻居 𝑗 所传播的信息进行归一化。(此处默认每个节点通过边对外发送相同量的信息, 边越多的节点,每条边发送出去的信息量就越小, 类似均摊. ) （要理解这个问题得先知道矩阵左乘和右乘的概念，参考《矩阵的左乘和右乘》）”
　　
参考：https://www.cnblogs.com/BlairGrowing/p/15826824.html
我的理解是，在这种方法中，即归一化了别人传来的表示向量；也为下一步将表示向量传出做准备——归一化传出的向量。

----1404
xswl中午惊闻这个csdn被同班同学默默关注着…emmm希望对大家有点帮助叭~继续读论文啦

3、α

不太理解这里的α，再看看后面的，实在不行就去看看代码啦~
在这里插入图片描述

感觉像是只是一个相似度的分值，没有说具体计算相似度的方法，看一下代码。
两个||好像是concat的意思。

4、思路

还是图清晰hhh
在这里插入图片描述

（1）先用GCN计算初始的结点向量

结点的初始特征如何选取呢？？？
在Implementation Details看到用的是Glove

（2）用节点表示，对边进行表示

在代码里写了些注释，但明显维度不太对，有机会debug一下看看（虽然我还不太会）。
总之，这个东西看起确实就是一个相似度分值，具体计算方法就是用learnable 的a分别计算对头节点和尾结点的相似度分数，然后二者相加，作为整体的边的分数。有二者融合的感觉，没有传统的查询的感觉hhh【不知道我理解的对不对，懒得翻其他帖子了，之后有时间再看】

    def forward(self, x_e, edge_index, rel):
        edge_index_h, edge_index_t = edge_index
        # 头结点transform后表示
        # (#e，r_hidden) = （#e，e_hidden）*（e_hidden, r_hidden）
        x_r_h = self.w_h(x_e)
        # 尾结点transform后表示
        # (#e，r_hidden) = （#e，e_hidden）*（e_hidden, r_hidden）
        x_r_t = self.w_t(x_e)
        # 头节点表示
        # a_h1(x_r_h):头结点transform后表示后，放入a_h1做线性变换
        # (#e,1) = (#e，r_hidden)*(r_hidden, 1)
        # squeeze()------tensor变量进行维度压缩，去除维数为1的的维度。
        ##(#e,1).squeeze()---->(#e)
        # e1是LeakReLU里面的一大坨，即最终相似度分值，用来生成对于x_r_h的注意力分值，learnable a_h1和a_h2
        e1 = self.a_h1(x_r_h).squeeze()[edge_index_h]+self.a_h2(x_r_t).squeeze()[edge_index_t]
        # e2用来生成对x_r_t的注意力分值，用了另外两个learnable a
        # 其实e1和e2目前看，完全对称，只是后续操作略有不同而已
        e2 = self.a_t1(x_r_h).squeeze()[edge_index_h]+self.a_t2(x_r_t).squeeze()[edge_index_t]
       # -----------------------生成基于头节点的关系表示
        # 生成头节点，注意力分值
        alpha = softmax(F.leaky_relu(e1).float(), rel)
        # 基于头节点的关系表示
        x_r_h = spmm(torch.cat([rel.view(1, -1), edge_index_h.view(1, -1)], dim=0), alpha, rel.max()+1, x_e.size(0), x_r_h)
        # -----------------------生成基于头节点的关系表示
        alpha = softmax(F.leaky_relu(e2).float(), rel)
        x_r_t = spmm(torch.cat([rel.view(1, -1), edge_index_t.view(1, -1)], dim=0), alpha, rel.max()+1, x_e.size(0), x_r_t)
        x_r = x_r_h+x_r_t
        return x_r