这次暑期基本上完成了之前制定的计划,具体完成程度如下:
1.和大家一起学习了吴恩达的深度学习课程。整个课程分为了五门课展开,分别为:第一门课神经网络和深度学习,第二门课改善深层神经网络:超参数调试、正则化以及优化;第三门课结构化机器学习项目;第四门课卷积神经网络和第五门课 序列模型。整个课程内容很详细,第一门课介绍了神经网络的基础和整个深度学习的核心内容,学习如何建立神经网络以及如何在数据上面训练神经网络,这部分内容和之前学习的机器学习内容有很多重叠部分。第二门课进行深度学习方面的实践,学习构建神经网络,如何真正让它表现良好,即学习超参数调整、正则化、诊断偏差和方差以及一些高级优化算法,如Momentum 和 Adam 算法。第三门课学习如何结构化机器学习工程,主要是学习不同情况下训练集和测试集的划分。第四门课介绍了通常用于图像处理方向的卷积神经网络(CNNs),以及如何搭建一个规范的CNN模型。第五门课介绍了序列模型以及在自然语言处理方面的应用。吴恩达的这个深度学习课程内容很经典,之后还是需要时间来复习。
2.暑期工作重心基本上都在写论文,研究论文代码。对于平台的功能修改部分有点无能无力,选择放弃这部分创新点。现在已经完成了phylo-Spark的论文写作和代码的重现,但也还在对照论文Parallel Multiobjective Metaheuristics for Inferring Phylogenies on Multicore Clusters进行修改,暂时定的论文名字是Parallel Multi-objective Evolutionary Algorithm with Combined Consensus on Spark,算法记作phylo-Spark。对于论文的数据图还有一些不太满意,在想办法修改中。
2.周志华的机器学习还没有看完,对于他里面很多的公式推导还是没有办法理解,周志华老师和吴恩达的很大的一个区别就是他涉及的应用不多,没有实例来帮助理解。
4.暑期没有看很多新论文,但是在查找论文的参考文献的时候重新看了很多论文,基本如下:
(1)Parallel Multiobjective Metaheuristics for Inferring Phylogenies on Multicore Clusters
(2)A Fast and Elitist Multiobjective Genetic Algorithm: NSGA-II
(3)MOEA/D: A Multiobjective Evolutionary Algorithm Based on Decomposition
(4)Improved Algorithms for Constructing Consensus Trees
(5)Performance evaluation of dominance-based and indicator-based multiobjective approaches for phylogenetic inference