图神经网络 The Graph neural network model

时间：2018-04-27 12:13:56 收藏：0 阅读：8173

1 图神经网络（原始版本）

图神经网络现在的威力和用途也再慢慢加强我从我看过的最原始和现在慢慢最新的论文不断写上我的看法和见解本人出身数学所以更喜欢数学推导第一篇就介绍图神经网络想法的开端之后的图神经网络模型都是基于此慢慢改进。

2 能处理的领域

技术分享图片

针对常见的旅行者问题社交网络分子结构等等常见的非结构化数据皆能进行处理不同点在于你g（x）即输出函数如何设计，图神经模型的贡献在于如何去学习一个非结构数据并将其表征

3 模型

3.1 简介

首先针对图而言信息有两大类一个为图节点信息一个为图边的信息图的节点包含了一个节点的“状态”，我们用x（i）来表示i节点的“状态” 这是模型经过学习之后学到的关于图信息的表征我们可以很直观的假设一个点的“状态”与周围节点的状态周围节点与本节点的边（可以认为是二者的距离）周围节点的标签然后我们用一个函数f 去学习于是我们可以得到以下的

技术分享图片

我们要做的工作就是去学习到整个图每个节点的“状态” ，但是我们会发现一个问题那就是 i节点的“状态‘’ x（i）依赖于j节点的状态x（j）同理j点也是二者不断地相互依赖形成一个循环。模型的假设就是我们可以通过循环迭代去求解全图的“状态”

3.2

我们引入我们的输出函数g（x，l）即一个节点的输出会与此点的“状态”以及相连的边有关

技术分享图片

由此我们得到了我们整体模型的两个函数一个去求解图的状态一个去输出（根据实际任务）

我们要解决的关键是f函数如何去求解整个图的状态数学上存在一个理论即f对x的导数小于1时，我们可以保证收敛技术分享图片

迭代过程简单而言就是用t轮的状态去更新t+1轮的状态，最终得到全图收敛的状态。

3.3

技术分享图片

因此现在我们可以将求解过程按轮次展开其中的g与f都为神经网络结构你可以自己设计我们将整个求解过程展开成如下形式其中前面都是不断迭代求解图的状态过程技术分享图片

3.4

前面介绍了图神经模型的大体思路接下来我将介绍梯度下降及求导过程因为图神经网络在求解过程中需要保证状态收敛才可以进行下一步所以求导迭代过程有所不同

首先我们介绍一下一个隐函数的存在性

技术分享图片

此函数反映了我们真实需要的状态x与我们现在所求t轮的x（t）之间的距离理论上可以证明存在能让我们求解到完美x的参数w，继而将参数w与x联系起来。

3.5

然后在引入我们的损失函数e 此函数如何定义损失与你的输出函数g有密切相关需要你自己设计再次不在累述。根据模型展开结构，我们得到了如下的求导公式技术分享图片

这个为通过时间的求导法则很接近传统rnn 我也不再累述。根据我们的假设当迭代一定次数后 z（t）等于z（t+1）技术分享图片

根据（8）得到（9）我们再根据我们之前证明存在的隐函数，以及根据隐函数求导法则得到（10），（11）为另一个方向求解导数不根据我们模型的展开，直接根据偏导定义直接求得结果将（9）（10）（11）带入得到了以下的求导法则技术分享图片

再次求导公式中全部转化为对参数w的求导接下来为z（T）的一个迭代过程类似于一个数列的求和技术分享图片

至此我们得到了我们全部的求导法则

技术分享图片

3.6 模型算法

在求导过程中我们是假设收敛到一个值时我们才能采用我们推导的公式进行求导因此算法方面我们需要增加两个步骤去验证收敛然后才能继续求导整体算法框图如下技术分享图片

4 总结

整体模型的贡献就是解决了如何去学一个非结构数据的特征，采用迭代到收敛值的方法去学习，可能大家也发现了针对两个点之间的联系边此模型并没有怎么重点关注现在的图神经思想类似不过加入了边的学习。

5 问题与自己想法

首先1）此模型在计算过程中要保证f对x的导数小于1 这点会让模型无法加深层数一高必然出现梯度消失之类问题

2）没有有效去学习边的信息

评论（0）

© 2014 mamicode.com 版权所有京ICP备13008772号-2 联系我们:gaon5@hotmail.com

迷上了代码！