唐杰教授分享了其同事的一篇论文(Network Embedding as Matrix Factorization:Unifying DeepWalk, LINE, PTE, and node2vec),这篇论文将图表示学习领域的 4 篇的经典文章改写称为了一个矩阵分解问题。唐杰教授简要的叙述了部分推导过程,并介绍了基于矩阵分解的方法和原方法的适用范围。此外,唐杰教授还分享了一些关于社交网络数据的研究和方法,由于是和腾讯合作,所以无法拜读。
清华大学另外一篇是关于 graph-based data 的任意阶相似度的 embedding方法的介绍(Arbitrary-Order Proximity Preserved Network Embedding)。乍一看,这一篇论文可能会被认为是 LINE 的二阶相似性的拓展,但其是从邻接矩阵的闭包进行考虑。这篇文章主要难点在于对于矩阵的转换,即将矩阵的多项式转变为特征值的多项式。常见的图表示学习方法一般通过随机游走来对图结构数据进行采样,这就导致了对于图的结构的完整性的缺失。虽然仅仅由邻接矩阵的闭包不能够很好地体现出连接的重要性(while random-walk based method can),但是其效果也是非常好的,如果有后续改进,应该会取得更好的结果。并且,这个方法的速度也很快。基于层次的图表示学习方法可能是对该论文的改进的方向,例如加入层次图的邻接矩阵的闭包,或许会有一个惊喜。
[size=15.1111px]自然语言处理
包含了一些基于语义分析方法,包含部分表征学习的方法。
[size=15.1111px]阿里
阿里在本次会议分享了一篇关于推荐的论文(Learninig Tree-based deep model for recommmender system)。其将深度学习与传统数据结构算法进行了结合,其将推荐问题看做一个线段树的查询问题(我认为比堆更贴切,和 有点类似于 kd 树)。每个物品只存储于树的叶子节点,然后通过区间查询(向量的相似度)来选择自顶向下的路径。
[size=15.1111px]metapath-based method
本次会议中许多论文用到了 metapath 及其相关的定义。浙江大学有一篇基于 metapath 的改进来学习 embedding 的论文(Interactive Paths Embedding for Semantic Proximity Search on Heterogeneous Graphs),其主要思想是想要学习采样得到的路径之间的语义关系,从而更好地捕获异构图中的语义关系,其行为和 metaGraph 有点相似。