|
本帖最后由 tangzk 于 2013-6-17 00:37 编辑
Qi He, Daniel Kifer, Jian Pei, Prasenjit Mitra, and C. Lee Giles. 2011. Citation recommendation without author supervision. In Proceedings of the fourth ACM international conference on Web search and data mining (WSDM '11). ACM, New York, NY, USA, 755-764. DOI=10.1145/1935826.1935926 http://doi.acm.org/10.1145/1935826.1935926
本文主要针对引用推荐问题,在作者之前的文章里,需要提供一部分参考文献,或者指定需要引用的位置。而本文所要解决的问题是在仅仅提供作者的一篇文章(称为测试文档),推荐一系列的引用,而且自动寻找引用所需要的位置。
相关应用:
链路预测,上下文分析,在线广告投放。
问题定义:
d为文档,表示为一系列词,该文档引用了其他文档\( r_1, ..., r_m \),引用位置l表示文档中引用r的位置,引用文本cl是指引用位置l附近的一系列词,可用来描述文档r和d的相关性。另外,文档d引用其他文档,该\(c_l\)称为out-link引用文本,如果文档d被其他文档引用,该cl称为in-link引用文本。
做法:先将测试文档分割为词窗口,每个窗口为100词(引用文本长度),判断这是否是引用文本(二分类),然后将相邻的窗口合并为为候选引用文本,每个候选引用文本\(c_i^{(d)}\)对应有权重\(y_i\),因此定义测试文档和引用文档的相似性为所有引用文本的相似性。
|
|