机器学习和生物信息学实验室联盟
标题:
林伟20161215_挖掘疾病相关基因: 一种基于异构网络边预测的数据整合方法
[打印本页]
作者:
linwei
时间:
2016-12-14 23:40
标题:
林伟20161215_挖掘疾病相关基因: 一种基于异构网络边预测的数据整合方法
标题: 挖掘疾病相关基因: 一种基于异构网络边预测的数据整合方法
分享人: 林伟
摘要:
1. 通过搜集数据构建异构网络;
2. 利用MetaPath方法从所得异构网络中提取基因到疾病的特征;
3. 训练正则化的逻辑回归模型, 预测与疾病可能相关的基因, 并找出那些对分类有用的特征(MetaPath);
4. 实验数据表明上述方法结果尚可。
总结:
1. 论文整合了多种数据;
2. 利用MetaPath提取特征, 改进后的方法考虑了节点的度数;
3. 由Lasso回归模型的表现可知, 整合的部分数据之间是相关的, 多种数据提供了冗余信息, 数据并非越多越好;
4. ROC曲线用于评估类别不平衡数据有缺陷, 存在AUROC较大, 但AUPRC很小的情况; 目前该方法的表现有待进一步提高;
5. 缺乏同其他方法的比较.
论文:
[1] Himmelstein DS, Baranzini SE (2015) Heterogeneous Network Edge Prediction: A Data Integration Approach to Prioritize Disease-Associated Genes. PLoS Comput Biol 11(7): e1004259. doi:10.1371/journal.pcbi.1004259
附件:
欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/)
Powered by Discuz! X3.2