|
三年的研究生生活即将结束,现将三年来的一些学习情况总结如下:
一、阅读计算机专业书籍:《数据挖掘导论》、《机器学习》、《算法导论》、《编程之美》、《编程珠玑》、《统计学习方法》、《R语言实战》、《深入理解计算机系统》、《深入理解程序设计》、《程序员笔试面试宝典》《剑指offer》。
二、阅读科研论文:
1. Solving 3-Coloring Problem with Timed Tissue P Systems,亚洲膜计算国际会议,2013;
2. The PageRank Citation Ranking : Bringing Order to the Web,http://www-db.stanford.edu/-backrub/pageranksub.ps,1998,9(1);
3. Time-Free Solution to Hamilton Path Problems Using P Systems with d-Division,《Journal of Applied Mathematics》,2013,(4);
4. 基于生物网络的疾病 microRNA挖掘技术研究,博士学位论文;
5. Matrix Factorization Techniques for Recommender Systems,《Computer》,2009,42(8);
6. The Link-Prediction Problem for Social Networks,《Journal of the Association for Information Science and Technology》,2007,58(7);
7. Network-based global inference of human disease genes,《Molecular Systems Biology》,2008,4(1);
8. Genome-wide inferring gene–phenotype relationship by walking on the heterogeneous network,《Bioinformatics》,2010,26(9);
9. Prediction and Validation of Gene-Disease Associations Using Methods Inspired by Social Network Analyses,PloS one,2013,8(5);
10. Walking the Interactome for Prioritization of Candidate Disease Genes,《American Journal of Human Genetics》,2008,82(4);
11. Ranking-based clustering of heterogeneous information networks with star network schema, ACM SIGKDD International Conference on Knowledge Discovery and Data Mining, June 28 – July,2009;
12. PathSim: Meta Path-Based Top-K Similarity Search in Heterogeneous Information Networks,《Proceedings of the Vldb Endowment》 , 2011,4(11);
13. Co-author Relationship Prediction in Heterogeneous Bibliographic Networks,International Conference on Advances in Social Networks Analysis and Mining,2011;
14. A Survey of Link Prediction in Social Networks,《Social Network Data Analytics》,2011;
15. Inductive matrix completion for predicting gene–disease associations,《Bioinformatics》,2014,30(12);
16. Cross Social Media Recommendation,The International AAAI Conference on Web and Social Media,2016;
17. Unsupervised Feature Selection on Networks: A Generative View,National Conference of the American Association for Artificial Intelligence,2016;
18. Integrative approaches for predicting protein function and prioritizing genes for complex phenotypes using protein interaction networks,《Briefings in Bioinformatics》,2014,15(5);
19. Jumping across biomedical contexts using compressive data fusion,《Bioinformatics》,2016,32(12);
20. PU Learning for Matrix Completion,《Computer Science》,2014。
三、创新性研究工作:
1. 提出基于概率分布的协同过滤预测模型。模型将基因–疾病关系通过概率分布转化为概率值,引入协同过滤算法对致病基因进行预测;在基础的协同过滤预测模型上,加入两项不同的约束,对基础模型进行优化,分别构建两个改进模型,提高了致病基因预测的准确度;考虑到生物异构网络中存在多数未知值的实际情况,对生物数据进行预处理,使致病基因预测过程更具有针对性,节约实验时间,提高实验效率。针对生物数据中负样本缺失的情况,采用随机游走的算法随机选取负样本,为之后的模型训练学习过程做好数据准备;结合非人类物种的基因–疾病表型数据,根据不同物种间的直系同源基因数据,构造生物异构网络;
2. 提出基于PU Learning的协同过滤预测模型。该模型将生物异构网络中的致病基因预测问题看做推荐系统中的推荐问题,以推荐系统中常用的矩阵形式表示生物异构网络,引入归纳型矩阵填补算法进行致病基因预测。在此基础上,加入PU Learning的方法。研究表明,该模型在预测学习过程中取得较好的效果,不仅有效解决了生物数据中负样本缺失的问题,并且能够对新出现的人类疾病和致病基因进行较准确的预测。
四、程序编写:
1. 在计算智能、视频分析前沿、算法设计与分析、近似计算、现代网络技术课程中,共编写代码约1500行;
2. 在论文实验与完成毕业设计过程中,共编写代码约500行。
附:毕业设计代码,供大家参考。 |
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|