机器学习和生物信息学实验室联盟

标题: 成都preKDD总结报告--章茜茜 [打印本页]

作者: qqzhang    时间: 2018-8-7 22:50
标题: 成都preKDD总结报告--章茜茜
                                                                          KDD Summer school 2018参会总结
        会议第一天由知名学者介绍自己的工作,第二天分为六个分论坛分别介绍录入到KDD2018中的优秀论文,涉及方面有智能推荐、智能城市、自然语言理解、深度学习、表征学习、多任务/半监督/多视角学习等六个。       
        京东副总裁郑宇教授做了题为“城市计算:用人工智能和大数据打造未来城市”的主题报告。展示了大量在京东中已经实现的人工智能应用,例如无人仓库拣货、无人车无人机送货等,同时也介绍了大数据与人工智能在城市商业经济以及交通等方面的应用。让我们认识到了理论层面上的研究一旦运用到商业和生活中将为我们的社会带来极大的进步。
百度副总裁沈抖做了题为“新移动时代的内容消费”的主题讨论,我觉得他提出的互联网现状很有见解,最初始的互联网是为了将世界从封闭走向开放,但是现在却已经反其道而行了。一个app或者网页经常性的和另外一个是不互通的,这带给用户很不好的体验,微信在这方面已经做出了自己的努力(微信小程序的开发)。但是这些互通的代价是很大的,百度利用人工智能开发的智能小程序支持搜索+信息流双引擎,可以让用户体验更优质、更多元化的服务。
        清华大学副教授、优青唐杰带来了题为“基于深度学习的社会影响力建模”的报告。他表示,随着大数据时代的迅速发展,从大数据中挖掘出群体或个体的隐含行为模式已成为数据挖掘的重要研究内容。他介绍了网络表示的相关研究方法,从起源到发展,总结了网络表示的研究路径。随后,讲解了DeepWalk、LINE、PTE、Node2Vec等不同的表示方法的矩阵表示,并给出了相关证明过程,这一部分内容是纯学术推导的,整个过程推下来很有成就感。他还分享了基于社会影响的社交网络分析,结合真实场景,实现从端到端的用户预测。唐杰副教授的报告是我觉得这些汇报中做的最好的,他有很严谨的公式推导过程,还有条理也十分清晰,并不是一直在说理论层面的东西,比较可惜的是他的ppt没有被大会共享。(唐杰副教授自己其实有说让我们不要拍照,会后会把资料发给负责人让我们去拷贝,但是最终也没有拿到,这个比较可惜。)唐杰副教授提出的基于隐含话题的异构社会网络建模和社会网络影响力分析模型也一直在由他的团队在进一步改善和运用。
        在智能推荐分论坛中,来自阿里的朱晗介绍的”Learninig Tree-based deep model for recommmender system”给我留下了比较深的印象,会议结束后在和他的交流中,他提到这个算法已经是被阿里淘汰了,现在阿里用的是在这个算法上的改进版本。算法的基本思想就是提出了一种新的基于树的方法,它可以提供对数复杂度预测关于语料库大小与更深层的神经网络。树型模型的主要思想是通过自上而下遍历树节点并决定是否将每个节点提供给用户来预测用户兴趣从粗到精。此外,树结构也可以共同学习,以更好地符合用户兴趣的分布,以促进培训和预测。这种推荐树每个圆圈代表一个节点,其实有点索引的意味,这样可以达到降低存储量。
        在深度学习分论坛中,来自华东师大的王露介绍了她的论文”Supervised Reinforcement Learning with Recurrent Neural Network for Dynamic Treatment Recommendation”,是一个通过机器学习算法来辅助医生开药的药物推荐算法。传统药物推荐算法主要分为监督学习(SL)和强化学习(RL)。SL 通过匹配医生的药方来训练模型,RL 通过优化病人输出进行学习。王露通过融合SL的指示信号和 RL 的评估信号来提升药物推荐效果。强化学习是我这次才知道的领域,之前我所学习的机器学习都只是将机器学习分为监督,半监督,非监督三种。强化学习的原理是它把学习看作试探评价过程,Agent选择一个动作用于环境,环境接受该动作后状态发生变化,同时产生一个强化信号(奖或惩)反馈给Agent,Agent根据强化信号和环境当前状态再选择下一个动作,选择的原则是使受到正强化(奖)的概率增大。选择的动作不仅影响立即强化值,而且影响环境下一时刻的状态及最终的强化值。这篇论文我觉得我们都可以看一下,我们对于强化学习的了解都比较少,而且药物推荐算法也比较热门。
        总结下来,我觉得这一次的preKDD之行还是让我见识到了新东西的,听作者汇报也会比自己看要来的直接,理解上的盲区也可以得到解释。同时也看到了自己的不足,也算是给自己一种压力吧。

作者: xzeng    时间: 2018-8-8 01:13
唐杰的报告很有意思,可惜没有PPT。唐杰今年已经评上了杰青,就比院士差一点了。




欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2