机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 4832|回复: 1
打印 上一主题 下一主题

概率图模型-课程学习总结

[复制链接]
跳转到指定楼层
楼主
发表于 2013-6-11 22:20:15 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 tangzk 于 2013-6-11 22:21 编辑

PGM课程的学习终于算是到了尾声,仅剩下本周的期末复习和回顾了。从11年开始,共报名参加三次PGM的学习,这次总算是坚持下来了。想着每周5~10小时看视频,10~15小时做课后作业与编程作业,依然觉得真是不容易。整体而言,这门课程的难度属于中等偏难,如果比起之前Andrew Ng的Machine Learning课程,这个则算是比较难的了。不仅从课程内容而言,从课后作业和习题的难度都是很大的,幸好我在研一的时候没有把这门课坚持下来,因为当时不可能有这么多的时间了,当然花这么多时间的原因,也因为我E文太差,视频基本上看字幕过来的。

这门课程不需要学生具备很多的机器学习知识,但应有一些基本的概率论统计及图算法知识。在这门课里,介绍了概率图模型Probabilistic Graphical Model的一些基本内容,配备了大量的习题和编程作业以熟悉概率图模型的基本概念和应用,就个人经验来说,很值得学习深入。
课程主要围绕三个方面的内容展开,这也是机器学习领域里面一些最基本的问题:
1、图结构的表达:
概率图模型用图的形式来表达概率的条件独立属性,将概率论与图论结合起来,其分类为贝叶斯网络(有向图)和马尔可夫网络(无向图)两种,各个结点表示为factor,结点间的基本运算有FactorProduct, FactorMarginalization, ObserveEvidence等,这两者即概率中的乘积、求边缘概率和代入证据等,然而其后的算法均可以围绕这几个基本运算来展开。

2、Inference:
推理问题,主要是为了计算某个变量的后验概率。在图模型中,可以有Vaiable Elimination(变量消元)和Belief Propagation(信念传播)两种算法来实现。通过将贝叶斯网络或马尔可夫网络化为Clique Tree或Cluster Graph,然后通过message passing来实现后验概率的计算,尤其是在化为Clique Tree后,可以在2(c-1)次消息传递后计算出整个网络中每个变量的边缘概率。另外,也可以通过采样方法来近似计算后验概率,常见的Gibbs采样和MCMC方法。由于MAP(最可能赋值)与后验计算有相似性,只需要将后者算法中的sum-product更换为max-sum操作即可,因此MAP问题也有类似的算法。

3、Learning:
学习问题,一是为了估计模型中的参数,当把参数不当成是固定值,而是随机变量时,仍然可以用推理的算法来计算后验概率。参数估计方法常用的是MLE(极大似然估计)、MAP(极大后验估计)和贝叶斯估计。二是为了学习网络的结构完成知识的发现,称为Structure Learning,其通常是定义各种有效的scoring function(如likelihood score,BIC,Bayesian Scores等),然后再通过搜索(固定树结构、启发式图算法)的方法来找到最优的结构,这中间还可以利用图的等效和可分解性。
关于学习问题,还有一个情况是关于incomplete data,即在含有某些hidden变量的时候,或者建模为Latent Variables模型时,需要通过EM(Expectation Maximization)算法来求解。

最后作下总结,整个课程基本上能独立完成所有的课后作业与编程作业,对概率图模型也有了很清晰的理解,也基本能看清论文中常见的各种模型的关系(这一些在课堂中也有讲)。由于在编程时已经被搭建了整个算法框架,因此在自己实现图算法时还需要理解其间各个步骤的细节,如Message Passing、Sampling Method等还有些问题,这些都还需要进一步系统地回顾课后习题和编程练习,后面再结合一起作下学习笔记才好。

整个课程的编程作业全部放在svn中(http://59.77.16.75/svn/seminar/tangzk/pgm/prog_assigns),关于整个课程的视频、slides以及Problems我这里也都有相关资料,暂时还未整理完,有兴趣学习的同学可以看一看,也可以和我一起交流,学习进步。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
发表于 2013-6-12 18:03:38 | 只看该作者
本帖最后由 chenwq 于 2013-6-12 22:08 编辑

总结得太好了~ 学习,学习!@tangzk

课程的教材是Koller写的,邹老师在论坛里发过(下载) @zouquan

我也打印了一份,需要的同学自己去7#442拿。
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-23 12:21 , Processed in 0.068910 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表