机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 1405|回复: 0
打印 上一主题 下一主题

林伟20161215_挖掘疾病相关基因: 一种基于异构网络边预测的数据整合方法

[复制链接]
跳转到指定楼层
楼主
发表于 2016-12-14 23:40:02 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

标题: 挖掘疾病相关基因: 一种基于异构网络边预测的数据整合方法

分享人: 林伟

摘要:

1. 通过搜集数据构建异构网络;
2. 利用MetaPath方法从所得异构网络中提取基因到疾病的特征;
3. 训练正则化的逻辑回归模型, 预测与疾病可能相关的基因, 并找出那些对分类有用的特征(MetaPath);
4. 实验数据表明上述方法结果尚可。


总结:

1. 论文整合了多种数据;
2. 利用MetaPath提取特征, 改进后的方法考虑了节点的度数;
3. 由Lasso回归模型的表现可知, 整合的部分数据之间是相关的, 多种数据提供了冗余信息, 数据并非越多越好;
4. ROC曲线用于评估类别不平衡数据有缺陷, 存在AUROC较大, 但AUPRC很小的情况; 目前该方法的表现有待进一步提高;
5. 缺乏同其他方法的比较.

论文:
[1] Himmelstein DS, Baranzini SE (2015)  Heterogeneous Network Edge Prediction: A Data Integration Approach to Prioritize Disease-Associated Genes. PLoS Comput Biol 11(7): e1004259. doi:10.1371/journal.pcbi.1004259

附件:

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-24 07:00 , Processed in 0.076062 second(s), 30 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表