​ICLR 2023 | GReTo:以同异配关系重新审视动态时空图聚合

news2024/5/18 16:28:44

54806f8de3defe7f215f63760e6286ac.gif

©PaperWeekly 原创 · 作者 | 周正阳

单位 | 中国科学技术大学

fb530f8d3a3b92180de5b269e8f7be20.png

论文简介

动态时空图数据结构在多种不同的学科中均普遍存在,如交通流、空气质量观测、社交网络等,这些观测往往会随着时间而变化,进而引发节点间关联的动态时变特性。本文的主要研究对象是动态时空图的回归任务,赋能交通、空气质量和气候预测。动态图学习中聚合偏离目标信息的邻居会导致图学习性能下降,因而我们重新审视了节点的邻居关系,通过对邻居关联进行分类并筛选有助于预测的有效信息进行聚合。

在本文中,我们借助图学习中的“同配性理论(homophily theory)”,提出了动态图“目标同配性度量方法”和“逐层重要性量化策略”,将同配性理论从静态图拓展至具有时空特性的动态图中。其中,目标同配理论捕获了目标状态与当前状态的差异性,通过构建有向符号以动态地、针对性地选择与目标一致的同配节点,即有效邻居实现节点级聚合;层重要性量化利用局部拓扑环境和目标感知度量不同传播层的有效信息量,以实现逐层有效传播。

本文在 ICLR 2023 评审过程中得分为 8,8,6,6,被接收为 Poster。

542ead51f58ed9295dad7f94e83d4064.png

论文标题:

GReTo: Remedying Dynamic Graph Topology-Task Discordance via Target Homophily

论文地址:

https://openreview.net/pdf?id=8duT3mi_5n

a07d363478017eea835ce400488af247.png

研究动机

拓扑-任务不一致性:现有的动态图回归任务往往使用图卷积神经网络(GCN),以物理连接或特征相似度构建邻接矩阵来进行节点级聚合。

如图 1 所示,以交通流量为例,节点 A 从 T 至 T+1 时间步发生了明显的流量增加,而此时在 T 步聚合大于其本身的节点 C/D/G 将是有效获得目标的策略,反之聚合其他节点则可能导致与任务目标相悖的结果,因而不是所有的(预定义)物理的拓扑均为有效,而当节点 A 在时序层面变化较大,则可能在 T 步直接聚合同配邻居也将失效。

因此,鉴于动态时空图具有节点关系多样性、动态性和时序演进关系,直接利用同配邻居或某一固定的拓扑结构进行消息传递会不可避免地导致某些时间步的聚合偏离回归目标,我们将这种现象称为拓扑-任务的不一致。因而在时空动态图中拓扑-任务不一致问题是推动动态图预测更精准的必经之路,同时将开拓动态图理论分析、动态图拓扑优化的新方法与新思路。

47f636fffb5f7aeb3d9526a20c9e51dc.png

▲ 图1 拓扑-任务不一致性示意图

这一问题的本质原因在于时空图所具有的本质时空异质性,这种异质性体现在不同的时间步、不同区域所具有的节点观测不尽相同,进而带来不同时间步的空间关联和时序依赖关系的不一致性。

在图学习理论中,同配性度量刻画了节点间的关系,其中,若有边相连的一对邻居节点具有相似观测或相同标签,那么这对邻居是一组同配成分,反之,若有边相连的一组邻居具有不同观测或不同的标签,那么其为一组异配成分,而时空动态图上往往同时存在同配和异配成分。

这种关联识别与解耦恰恰为我们的有效节点选择带来了潜在可能。然而,传统的同配性理论大多在静态图和分类任务中开展研究,很少在跨时间步、具有连续观测的动态图回归任务上进行研究,因此,我们认为基于同配理论实现个性化聚合仍然存在以下几个挑战:

1. 如何基于连续值确定节点间的同配关系,并将这种刻画节点关联的范式拓展至连续数据观测?

2. 如何利用不同节点在时序方面的演进趋势和当前节点间的关联,筛选有利于达成预测目标的有效邻居?

3. 如何量化局部邻域信息与目标信息的关联,实现时空异质环境下的图信号高阶传播?

为解决以上挑战,我们重新审视了节点关系,利用同配关系的定义拓展了具有符号和距离的动态图上节点关系度量机制。我们发现,在预测任务中,将同配聚合提升为有符号的目标引导的消息传递,可以有效地解决上述提出的拓扑-任务不一致问题,提高聚合能力。

因此,本文提出了一种新的图神经网络 GReTo,该模型通过构建目标同配性度量来选择有效邻居,进而修正时空数据预测中的拓扑-任务不一致。贡献总结如下:

1. 我们提出了时空图中因异质性带来的拓扑-任务的不一致问题,形式化了动态图同配理论,将同配性理论从静态图分类任务拓展至动态图回归任务,利用图学习理论进一步拓展了时空数据性质分析和时空学习建模方法;

2. 我们提出了一个基于目标同配性修正拓扑结构的图神经网络并建模时空异质性,其包括基于目标同配的有符号信息传递和基于层重要性的高阶图信号传播;

3. 我们在交通、气候、空气质量等不同领域的四个动态图上评估了我们的解决方案,并成功地在 MAPE 指标上实现了 3.20% 到 24.79% 的提升,并表明负异配性越高,有符号的有向消息传递机制将不同成分解耦并聚合的优势越明显。

fce898490b0d9846733f78cc4b85e8f2.png

方法

我们首先构建了动态图的同配性计算机制,该机制由图内空间同配性与图间转移同配性组成。我们的 GReTo 模型将由三个部分构成:1)目标为中心的信息传递;2)个性化高阶逐层传播和 3)时序卷积模块。

35ab484ab10d39d2f982dda9ba5eef9e.png

▲ 图2 GReTo模型总览

3.1 同配性度量与邻域同配关系描述向量

定义1:图内空间同配性与图间转移同配性。为适应连续型数值变量的关系度量,我们提出基于符号和阈值的划分方法。具体而言,基于特征距离的分类阈值 ,将图内同配性和图间同配性可以分为三类,正向异配(+1,比给定观测大);同配(,与原有观测相仿);负向异配(-1,比给定观测小)。

对于节点 和 ,同配度量的符号表示 相对于 的方向,即节点 聚合 时, 的节点数值会如何变化,而距离表示相差的程度。给定一个序列图 、时间步长 和节点 ,图内同配性 和图间同配性 分别表示为:

c83650d9eb1738354886f708be86d8d1.png

▲ 图3 动态图同配性度量计算机制

其示意图如下:

3b99c5115352aa1abb0dcbc772a71d25.png

▲ 图4 动态图同配性度量示意

其中,图内同配度量主要承担了同一时间步上的空间上关系度量,而图间同配性搭建起不同时间步图上不同节点间依赖关系的桥梁,用于捕获时序上的演进关系。

定义2:局部邻域环境(LNE)。为利用同配性度量进一步刻画邻域状态,同时描述邻域拓扑和邻居亲和度关系,我们提出了 LNE 度量,即依照正向异配、同配和负向异配三类划分邻域成分,并构成邻域描述向量 :

5727acb0a12bf09c2733c2f7045faf55.png

▲ 图5 动态图邻域度量

3.2 目标为中心的消息传递

研究发现,在时空回归预测任务中,当待预测时间步中的观测与当前时间步的观测相差较大时,其无法通过仅聚合当前时间步中的同配邻居回归得到。事实上,图上观测间的关系不仅是现有工作所认为的“同配性”,而是可能同时具有正向关联和负向关联的,如处于上下游的两个路口必然存在正向关联,而处于相同OD中的不同路径中的节点必然存在竞争关系,即你弱我强的负向关联。

因此,将同配邻居的聚合拓展至“有符号的有向聚合”,以不同学习参数聚合正向和负向信息,将提升图表征能力和聚合回归效果。

目标为中心的邻居发现:在时序同配性和空间同配性度量中,若两者符号方向一致,则表示时序演进方向与空间聚合方向一致。基于此,我们将空间同配和时序演进同配耦合,基于图内同配(即当前空间关联)和图间同配(即时序演进方向)度量导出当前时间步的邻域聚合方向。首先,我们构建了 mask 矩阵 ,其由图间同配性与图内同配性相除计算得到:

a251845955bbf4be90b2ba9be534376b.png

其中 表示按位相除。

以上“相除”的设计使得 中的每个 均为较丰富的边描述,即每个边值不仅可以区分目标为中心的节点(有利于聚合达成目标的节点),还能够度量节点间的接近程度,其中较大的边值意味着更大目标一致性和聚合贡献。通过基于边号对 M 进行分割,我们可以实现面向目标的同配邻居和异配邻居:

c5c550b60033da3693babc787d673e75.png

其中, 选中了邻居中与目标演进方向一致的节点,而 选中了与目标演进方向相悖的节点。因此需对这两类节点实行不同的卷积核进行学习。

跨图(图间)转移同配性预测器:鉴于在动态图预测任务中,图间同配性在测试阶段是不获得的,因此我们设计了一个序列分类任务来预测每个节点的图间同配性。分类器的输入是每个节点的前序观测,输出是局部邻域环境向量LNE。我们将取最大的概率值视作为预测得到的 。

解耦的有向信息传递:基于获得的 和 ,可根据不同类型的关联构建有向信息传递。我们将 和 分别施加于邻接矩阵 以获得带符号的邻接矩阵:

41fd57a4ed066c8f90f1683b34630ef9.png

▲ 图6 生成新邻接阵

而后进行聚合:

a5148ff364e95e6b8f066db844e50c50.png

▲ 图7 生成新邻接阵

事实上,在滤波器当中,与给定节点变化方向相一致的邻居可以视作低通信息,而变化方向相异的可以视高通信息,因此,在此处 和 可以分别视作低通和高通滤波器。

个性化的高阶逐层传播:由于 GNN 的层数,即节点的传播深度是一个离散变量,很难对其直接优化,因此,我们设计了一种自适应层重要性度量,利用邻域信息与目标信息间的相似性来量化每一层重要性。我们首先导出了局部环境与传播步数的关系,而后基于该关系提出层重要性度量,并实现图上信号的高阶传播。

局部邻域环境与传播步数的关系:1)给定节点,他的传播步数由每一层的目标同配比率 和该节点 的度有关;2) 和 越小,传播的步数应越大。

自适应层重要性度量:为了获得目标同配的高阶邻居,我们将层重要性量化这一挑战转化为度量高阶邻居分布与跨图时序同配性分布间的一致性。首先,我们可以通过对邻接矩阵进行幂计算获得 在第 k 个传播步的表征 ,而对于跨图时序同配性分布可以由时间序列分类器得到  ,因此 明确包含有目标信息。

因而,我们将 与 进行点积,并保留每一行的最大值以抑制其他非目标同配成分的干扰。该点积获得信息即表示该节点在该层所包含的目标相关的信息量,进一步地,经验表明,度数越大、层数越小,传播深度应越深,因此逐层重要性度量由下式给出:

3c41884d164ce043193746ceebef2881.png

▲ 图8 层重要性

其中 表示节点 在第 层的度。

个性化高阶传播模块

为了获得归一化的逐层传播权值,我们对获得的 施加了可学习的 MLP 变换和 Softmax 函数:

565039bdda932d26c0e14b230808b721.png

而后,我们即可对其在低通和高通部分分别进行传播,由于高通部分的重要性相较于低通部分较小,我们仅考虑了 引导下的高阶传播:

82cb7c2b2ec89ac88b5f852510fe3eff.png

▲ 图9 高阶传播

由于动态时空图预测存在多步到单步或多步到多步的情形,我们将该高阶传播模块嵌入到每一时间步中。

时序感知模块

我们沿用了 STGCN 中的三明治结构,将时序学习模块部署于修正的空间依赖学习模块前后,并基于 TCN 实现了时序依赖的捕获:

1daca1414313b5358771435f41b1eeb0.png

优化目标

最后,我们的优化目标由两方面组成,一是跨图转移同配性预测器,其为一个三分类的序列分类器,二是普通的回归预测任务。因此,我们的优化目标如下:

5c77e85427c0f9c2df0602851ab5126a.png

▲ 图10 优化目标

a7dfb307b1cef71a9f60dc034962e458.png

实验

我们在交通流(Metr-LA, PeMS-Bay)空气质量(KnowAir)、气候环境(Temperature)等多个领域的时空动态图数据集上开展了实验。

由于时序跨图同配预测对接下来的任务至关重要,我们首先验证了该预测器的性能,预测准确率如下:

Metr-LA:0.78 PeMS-Bay: 0.60  KnowAir: 0.86  Temperature: 0.68。以上预测的准确率均高于 60%,表明了其可为接下来的邻居同配节点选择提供较好的保障。

实验结果如下图所示。

0fad1538430eaadf5a565034bf90b67b.png

▲ 图11 实验结果

在预测任务中,我们的方法可以获得 3.61%~24.79% 的性能提升。我们发现,具有同配-异配建模能力的 GCN,如 EGConv 和 H2GCN,比不具备异配邻居建模能力的模型预测效果好;同时,我们的方法在异配性较高,尤其是节点负向异配性较高的数据集上性能提升较大,如 KnowAir(负向异配性 = 27%)。

086d4e956869daf225dd97edb854bfa4.png

▲ 图12 案例分析

我们将在 Metr-LA 上的数据和模型可视化于下图,其中图(a)表示的是层次性的节点分布(橙色节点表示具有较高 degree 的节点),图(b)展示了 GReTo 在 3 阶 GNN 传播中的权值。我们发现度越小的节点,往往传播层数的越深,而度越高的节点传播层数越小。该案例分析可以为本工作的解释性提供一定支撑。

81328abbe6d99bb408762ab3656beeaf.png

c420e99fc1840f7e4ff255d40d57a930.png

▲ 图13 案例分析

进一步地,消融实验与多步预测实验进一步验证了 GReTo 各模块的有效性与可扩展性。

7b6cc70335397389ebf5f6c24de4fdc9.png

结论

在本文中,我们从时-空视角重新审视节点关系,提出了动态同配性理论,该同配性理论为动态图数据分析提供了重要手段,同时基于图同配分析,我们展示了拓展多类型邻居聚合可以获得表征能力的提升。

因此,我们提出了一种新的 GNN,GReTo,该 GNN 集成了目标为中心的消息传递和基于层重要性的高阶传播,实验验证了 GReTo 在四种动态图上的优越性。未来,我们将继续研究如何基于同配性理论进一步改进更多类型的动态图学习,例如边类型预测、多步时空图序列预测等。

更多技术细节和实验分析请参见论文原文!同时欢迎从事 GNN、时空学习相关研究的小伙伴一同交流探讨!

更多阅读

7887406eda12fd3b48abf46bbcd01dfb.png

3fb0d0b1921020bc743e6a58ac6a9117.png

25bf09e96b76387492ed95c73a32660d.png

fcedc31219defd200e3bfd59026810f7.gif

#投 稿 通 道#

 让你的文字被更多人看到 

如何才能让更多的优质内容以更短路径到达读者群体,缩短读者寻找优质内容的成本呢?答案就是:你不认识的人。

总有一些你不认识的人,知道你想知道的东西。PaperWeekly 或许可以成为一座桥梁,促使不同背景、不同方向的学者和学术灵感相互碰撞,迸发出更多的可能性。 

PaperWeekly 鼓励高校实验室或个人,在我们的平台上分享各类优质内容,可以是最新论文解读,也可以是学术热点剖析科研心得竞赛经验讲解等。我们的目的只有一个,让知识真正流动起来。

📝 稿件基本要求:

• 文章确系个人原创作品,未曾在公开渠道发表,如为其他平台已发表或待发表的文章,请明确标注 

• 稿件建议以 markdown 格式撰写,文中配图以附件形式发送,要求图片清晰,无版权问题

• PaperWeekly 尊重原作者署名权,并将为每篇被采纳的原创首发稿件,提供业内具有竞争力稿酬,具体依据文章阅读量和文章质量阶梯制结算

📬 投稿通道:

• 投稿邮箱:hr@paperweekly.site 

• 来稿请备注即时联系方式(微信),以便我们在稿件选用的第一时间联系作者

• 您也可以直接添加小编微信(pwbot02)快速投稿,备注:姓名-投稿

2a3ecc574e6e70f14d3cdbef0eab1cdf.png

△长按添加PaperWeekly小编

🔍

现在,在「知乎」也能找到我们了

进入知乎首页搜索「PaperWeekly」

点击「关注」订阅我们的专栏吧

·

9957f4f07d9f3d2805f909bd6f47b421.jpeg

本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/340238.html

如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!

相关文章

springboot学习(八十) springboot中使用Log4j2记录分布式链路日志

在分布式环境中一般统一收集日志,但是在并发大时不好定位问题,大量的日志导致无法找出日志的链路关系。 可以为每一个请求分配一个traceId,记录日志时,记录此traceId,从网关开始,依次将traceId记录到请求头…

【C#】[带格式的字符串] 复合格式设置字符串与使用 $ 的字符串内插 | 如何格式化输出字符串

复合格式输出 string name "Fred"; String.Format("Name {0}, hours {1:hh}", name, DateTime.Now);通过指定相同的参数说明符,多个格式项可以引用对象列表中的同一个元素。 例如,通过指定“0x{0:X} {0:E} {0:N}”等复合格式字符…

凸优化学习:PART3凸优化问题(持续更新)

凸优化问题 凸优化问题的广义定义: 目标函数为凸函数约束集合为凸集 一、优化问题 基本用语 一般优化问题的描述: minimize⁡f0(x)subject to fi(x)⩽0,i1,⋯,mhi(x)0,i1,⋯,p(1)\begin{array}{ll} \operatorname{minimize} & f_0(x) \\ \text { s…

Centos7 安装Hadoop3 单机版本(伪分布式版本)

环境版本CentOS-7JDK-8Hadoop-3CentOS-7 服务器设置设置静态IP查看IP配置在/etc/sysconfig/network-scripts/目录下的ifcfg-ens33文件中。[rootHadoop3-master sbin]# cd /etc/sysconfig/network-scripts [rootHadoop3-master network-scripts]# ll 总用量 232 -rw-r--r--. 1 r…

云计算培训靠谱吗?

怎么算靠谱的培训呢? 举个例子: 我想参加云计算培训找个工作,机构满足了我的要求,有工作了,但是不是做云计算相关的。 小强也参加了云计算培训,想学好云计算成为技术大牛,最后专业学得普普通…

java环境配置

java环境配置步骤下载jdk安装jdk配置环境变量通过控制台命令验证配置是否成功大功告成安装教程: https://blog.csdn.net/m0_37220730/article/details/103585266 下载jdk 若不理解JDK/JRE/JVM的关系,可以点此查看初识Java(概念、版本迭代、…

DIN解读

传统的Embedding&MLP架构将用户特征编码进一个固定长度的向量。当推出一个商品时,该架构无法捕捉用户丰富的历史行为中的多样性兴趣与该商品的关联。阿里妈妈团队提出了DIN网络进行改进,主要有如下两点创新: 引入注意力机制来捕捉历史行为…

【Linux下代码调试工具】gdb 的基本使用

gdb的基本使用前言准备gdb工具调试须知gdb的基本指令进入调试退出调试显示代码及函数内容运行程序给程序打断点查看断点位置断点使能取消断点逐过程调试逐语句调试运行到下一个断点查看变量的值变量值常显示取消变量值常显示前言 在主页前面的几篇文章已经介绍了Vim编辑器及Ma…

C语言(内联函数(C99)和_Noreturn)

1.内联函数 通常,函数调用都有一定的开销,因为函数的调用过程包含建立调用,传递参数,跳转到函数代码并返回。而使用宏是代码内联,可以避开这样的开销。 内联函数:使用内联diamagnetic代替函数调用。把函数…

【MySQL】 事务

😊😊作者简介😊😊 : 大家好,我是南瓜籽,一个在校大二学生,我将会持续分享Java相关知识。 🎉🎉个人主页🎉🎉 : 南瓜籽的主页…

opencv窗口的创建/显示/销毁

大家好,我是csdn的博主:lqj_本人 这是我的个人博客主页: lqj_本人的博客_CSDN博客-微信小程序,前端,python领域博主lqj_本人擅长微信小程序,前端,python,等方面的知识https://blog.csdn.net/lbcyllqj?spm1011.2415.3001.5343哔哩哔哩欢迎关注…

Docker-harbor私有仓库

一、Harbor概述 1、Harbor的概念 • Harbor是VMware公司开源的企业级Docker Registry项目,其目标是帮助用户迅速搭建一个企业级的Docker Registry服务 • Harbor以 Docker 公司开源的Registry 为基础,提供了图形管理UI、基于角色的访问控制(Role Base…

力扣SQL刷题9

目录1107. 每日新用户统计-勉强579. 查询员工的累计薪水 - 各种绕易错点:range与rows区别615. 平均工资:部门与公司比较with建临时表注意点1107. 每日新用户统计-勉强 题型:每个日期中首次登录人数 解答:从原表中用按用户分组后m…

嵌入式开发----示波器入门

示波器入门前言一、示波器介绍关键指标工作原理二、功能按钮介绍三、一键入门四、 典型应用场景校准捕捉测试总线通讯总结前言 对于嵌入式工程师来说,示波器的使用极为重要,他就像是“电子工程师的眼睛”,把被测信号的实际波形显示在屏幕上&…

Java特性之设计模式【桥接模式】

一、桥接模式 概述 桥接(Bridge)是用于把抽象化与实现化解耦,使得二者可以独立变化。这种类型的设计模式属于结构型模式,它通过提供抽象化和实现化之间的桥接结构,来实现二者的解耦 这种模式涉及到一个作为桥接的接口…

67. 二进制求和

文章目录题目描述竖式模拟转换为十进制计算题目描述 给你两个二进制字符串 a 和 b ,以二进制字符串的形式返回它们的和。 示例 1: 输入:a “11”, b “1” 输出:“100” 示例 2: 输入:a “1010”, b “1011” …

“白学”了十几年?这两年才感悟出的高效学习方法

作者:元青 微信公众号 「技乐书香」 引言 虽然从小学开始算起,一直到我现在硕士快毕业,已经学习了接近十九年了,但是只有最近两年算得上真正的在"学习",之前的十七年都没有明白也没有认可学习的意义&#…

网络安全实验室7.综合关

7.综合关 1.渗透测试第一期 url:http://lab1.xseclab.com/base14_2d7aae2ae829d1d5f45c59e8046bbc54/ 进入忘记密码页面,右键查看源码,发现一个手机号 解题思路:通过给admin用户绑定13388758688手机号码,然后再进行…

【软件测试】企业测试面试题9道,从自我介绍到项目考察+回答......

目录:导读前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结(尾部小惊喜)前言 1、自我介绍 您好&a…

leaflet 上传WKT文件,在地图上显示图形(示例代码055)

第055个 点击查看专栏目录 本示例的目的是介绍演示如何在vue+leaflet中加载WKT文件,将图形显示在地图上。WKT(Well-known text)是一种文本标记语言,可以表示的几何对象包括:点,线,多边形,TIN(不规则三角网)及多面体。可以通过几何集合的方式来表示不同维度的几何对象。 …