论文标题: Community Detection Using Multilayer Edge Mixture Model
作者: Han Zhang,∗ Chang-Dong Wang,y and Jian-Huang Lai Philip S. Yu
博客链接: 博文链接 注意, 并不会写得更好
![]()
摘要
本文针对多层的网络数据--可能主要是对它进行社区发现--做了以下工作:
1. 提出多层边混合模型(multilayer edge mixture model MEMM),从边组合的视角(观点),探索一种通用的社区结构评估器
2. 展示了从MEMM可以推导出多层颗粒度(multilayer modularity)和随机块模型(stochastic blockmodel)
3. 探索以MMEM的形式,对特定形式的社区结构评估器进行分解。这样可以发现评估器的新的解释。
![]()
基础Reichardt and Bornholdt提出的 边反馈方案(rewarding scheme of edges), 应用于单层网络
1. 奖励社区内存在的边
2. 惩罚社区内不存在的边
3. 惩罚社区间存在的边
4. 奖励社区间不存在的边
所以这个意思非常直观, 因为是应用于单层的, 所以明显再给多层网络 添加几条规则就是成功扩展了。
MEMM[size=1.1em]在边反馈方案的基础上:
[size=1.1em]如图:
![]()
参数说明
- s和r代表层, node is代表i点在s层
- A, C, v 矩阵分别表示 层内邻接、 层间邻接和社区标签
- abcdefgh是超参数,混合系数
- P是两点同属一社区的概率, 支持模糊划分 fuzzy partition.
- lambda(w)函数, 大于w,返回1, 否则 -1
关于hyper parameter的设定[size=1.1em]策略: [size=1.1em]可行做法: - 根据边的贡献比例, 选择固定值(贡献比例怎么求?)
- 网络变更后,重算参数
[size=1.1em]
![]()
[size=1.1em]之后的工作是从MEMM来推导: - 模块性(Modularity)
- SBM stochastic blockmodel 随机块模型
通过设定超参数 hyper parameters 的值就可以做到, 所以MEMM是个更加通用的模型。 结论就是这样。
![]()
接下来是说明可以将评估器分解成MEMM的形式
[size=1.1em]不太理解这块和上一块推导有多少区别。 模块性和随机块模型是否也算是评估器。内容上看起来没太多区别。 [size=1.1em]意义在于: [size=1.1em]decomposition of an evaluator reveals the preference of the evaluator [size=1.1em]但evaluator是什么和如何decompose 都没讲好的感觉 [size=1.1em]
![]()
[size=1.1em]实验部分写了很多分析讨论内容, 看着有点晕。 总结
- 复杂,长
- 语言也比较复杂~~~介绍部分大段文本看着眼花缭乱
- 内容比较多, 理论部分也多, 实验内容也多。 很繁杂的感觉。
创新点主要是将单层的边反馈方案(rewarding scheme of edges) 扩展到了多层。
后面的推导其他评估器或分解评估器部分, 如果在单层就用边反馈方案做过推导、 分解, 那创新性可以忽略了。 如果没有, 那就相当于, 发现这种模型是种更加通用的评估器、模型, 并且验证了如何推导、 分解。
本文重点不在于提出一个算法去解决、 提升效率。 以我有限的知识水平和语言水平来看~~~提出这么一个更通用的表达形式, 就相当更抽象了一层,境界更加高了, 就像线性方程组抽象成线性代数, 线性代数再抽象成抽象代数。 那以前的其他的模型就可以看作是这个模型的特殊形式, 本质上来说, 那些模型都是等价, 只是各自的侧重点不一样。
如果模型是等价的, 那不同模型使用的策略(损失函数)——不过一般都用的NMI——和优化算法 不一样, 是否在模型的侧重点上也有体现。
总之, 这是一篇我看着比较抽象, 不太能把握住重点的论文。
|