标题: 挖掘疾病相关基因: 一种基于异构网络边预测的数据整合方法
分享人: 林伟
摘要:
1. 通过搜集数据构建异构网络;
2. 利用MetaPath方法从所得异构网络中提取基因到疾病的特征;
3. 训练正则化的逻辑回归模型, 预测与疾病可能相关的基因, 并找出那些对分类有用的特征(MetaPath);
4. 实验数据表明上述方法结果尚可。
总结:
1. 论文整合了多种数据;
2. 利用MetaPath提取特征, 改进后的方法考虑了节点的度数;
3. 由Lasso回归模型的表现可知, 整合的部分数据之间是相关的, 多种数据提供了冗余信息, 数据并非越多越好;
4. ROC曲线用于评估类别不平衡数据有缺陷, 存在AUROC较大, 但AUPRC很小的情况; 目前该方法的表现有待进一步提高;
5. 缺乏同其他方法的比较.
论文:
[1] Himmelstein DS, Baranzini SE (2015) Heterogeneous Network Edge Prediction: A Data Integration Approach to Prioritize Disease-Associated Genes. PLoS Comput Biol 11(7): e1004259. doi:10.1371/journal.pcbi.1004259
附件: |