大学生创新性实验计划重要通知 希望由我带领参加大学生创新性实验计划或者加入我的研究小组的同学请注意: 我今年为大家开设了以下几个项目,项目介绍和要求都(尽可能)详细的写在下面。由于科研项目本身存在不确定性,项目目的和实现方法可能会随着项目进程有微小调整。有兴趣参与的同学请和队员讨论确定并跟帖。如果有多组同学报了相同项目,我将以报名顺序为准。 【需要说在前面的话】所有项目都有时间限制,因此,请报名同学慎重考虑。在项目截止时间前是否能够投入较多时间,参与TREC项目是否能够暑假留在学校工作并保证每日工作时间,是否有认真踏实勤奋的工作态度。基础并不是非常重要,老师会指导你们开展科研工作,但一定要有一颗不功利的心,热爱学习、刻苦努力。项目中的要求都不是硬性的,如果有较好的自学能力,都可以很快掌握。 【参赛回报】基本上,我不鼓励同学是为了挣钱这种肤浅的目的。参与比赛是对自我的挑战,充满了精神上的愉悦。但是,为了使大家更有刺激感,我选择的大部分是国际比赛类项目,有些项目设置了奖金,希望同学们能有好的表现摘取“巨额”奖金。项目结束后,老师会帮助大家撰写科研论文并投稿。如果文章发表的话将资助同学去开会(老师负担路费、会议注册费和住宿费,旅游门票费用自负)。另外,实验室配备了机位,鼓励同学在实验室工作。如果在实验室工作将给予适当生活补贴。 【项目1】TREC Micro-blog Search 【项目简介】TREC 微博检索任务。 TREC文本检索会议,是信息检索领域最权威的会议,由美国国防部和美国国家技术标准局(NIST)联合主办,自1991年举办第一届会议起已有20余年历史。该会议每年举办一次,开设若干任务(Track),任务瞄准当前业界最关注的新课题,由会议提供标准数据集和问题集,并对各参赛者在规定时间内提交的答案进行评测,评测结果将公开,已成为信息检索领域的权威评测数据。该会议每年都吸引了一大批国际一流科研机构和高校参与,包括MIT、CMU、Stanford、UCB、微软研究院、Google研究院、Yahoo研究院、IBM研究院、国内知名高校包括北京大学、清华大学、复旦大学等,并且在不断增加。 【项目目标】在Twitter(美国的微博)数据集上帮助用户做微博检索和关注推荐。比如说,一个用户对英国王室婚礼感兴趣,那么他给出一个查询“威廉王子婚礼”,系统要将英国王室婚礼最新最权威的动态告诉他,还要告诉他可以去关注什么人来得到最新消息。这个应用紧跟当前的微博热潮,有商业前景。 【参与人数】可以有两个队伍参加 【时间】三月份会放出数据集和具体的用户查询和系统目标。9月份左右提交结果。要求暑假期间留校工作!这个项目明年同样时间还会举行,可以作为长期项目 【要求】会涉及到Java或者C#编程。会涉及到概率知识。数据是html网页。 【项目2】TREC Medical-Record Search 【项目简介】TREC 病历检索任务。 TREC文本检索会议,是信息检索领域最权威的会议,由美国国防部和美国国家技术标准局(NIST)联合主办,自1991年举办第一届会议起已有20余年历史。该会议每年举办一次,开设若干任务(Track),任务瞄准当前业界最关注的新课题,由会议提供标准数据集和问题集,并对各参赛者在规定时间内提交的答案进行评测,评测结果将公开,已成为信息检索领域的权威评测数据。该会议每年都吸引了一大批国际一流科研机构和高校参与,包括MIT、CMU、Stanford、UCB、微软研究院、Google研究院、Yahoo研究院、IBM研究院、国内知名高校包括北京大学、清华大学、复旦大学等,并且在不断增加。 【项目目标】现在有美国几百所医院的病人病历(如医生诊断、X光病历等等),是电子格式的。在这些电子病历数据集上做检索,比如说输入感冒,系统自动发现病例中感冒都有些什么症状,开了什么药,治疗是否有效果等。这个应用很有科学意义,可以自动帮助医生诊断、科学家进行疾病研究,也可以帮助病人进行自我预防。 【参与人数】可以有两个队伍参加 【时间】三月中会放出数据集和具体的用户查询和系统目标。9月份左右提交结果。要求暑假期间留校工作!这个项目明年同样时间还会举行,可以作为长期项目 【要求】编程语言可以是java/c#/c/c++。会涉及到概率知识。要求英文较好,因为病历是全英文的,而且英文难度较高。数据是xml格式。 【项目3】KDD Cup Music Recommendation 【项目简介】KDD Cup音乐推荐。 KDD是数据挖掘和知识发现领域的顶级会议,对于这个会议不需要太多介绍,是所有数据挖掘、知识发现领域研究者和企业界人士最认可的权威会议,它每年设置一个KDD Cup,发布数据集和任务要求,供全世界的研究团队和个人参与比赛,设有奖金。 【项目目标】Yahoo 音乐(http://new.music.yahoo.com/)上有很多的用户对各种音乐做了评价,比如对不同风格的乐曲、音乐家打分。现在我们要帮助用户进行音乐推荐。因为用户通常只对一小部分音乐打分,我们要自动发现他们可能喜欢的音乐和不喜欢的音乐,预测对于每一首没有被评价过的歌曲(或者音乐家),这个用户会打几分。这个应用也很有商业前景。获得比赛第一名有5000 美金奖励。 【参与人数】1个队伍 【时间】数据集和系统目标都已经给出。6月30日提交结果。 【要求】如果对国外音乐家比较熟悉的话可能有帮助(这个不是要求) 【项目4】学术推荐 【项目简介】非比赛型项目 【项目目标】是否发现大学图书馆的检索系统很不方便呢?现在我们有厦门大学图书馆的数据。希望能够开发一个自动学术推荐系统,帮助同学们更好的检索图书、并且(根据同学当前的学期、状态等)给同学自动推荐好的参考图书。这个项目是很贴近我们学习生活的实用项目,而且可以马上让全校同学看到我们的工作成果!这个项目图书馆会发给同学们工资。 【参与人数】1个队伍 【时间】现在可以开始,结束时间看项目进度。 【要求】会涉及到概率知识。涉及到矩阵。涉及到java/C# 【项目5】Kaggle Chess Game Prediction 【项目简介】Kaggle 国际象棋预测比赛 【项目目标】国际象棋基金会希望能够预测每个棋手的表现。现在有过去11年5万多个国际象棋棋手的比赛记录,预测接下来3个月他们的世界排名会怎样?这个项目第一名有1万美金奖金。 【参与人数】1个队伍 【时间】现在-5月4日 【要求】会涉及到概率知识。涉及到矩阵。 【项目6】人才推荐 【项目简介】非比赛型项目 【项目目标】找工作怎么办?上人才网站?需要提交复杂的查询表单,还是找不到合适的工作。招聘单位也遇到了同样的问题。希望我们能提供好的人才检索推荐系统,帮助招聘单位快速准确的检索到需要的人才,也帮助每个毕业生能够找到合适的单位。这个项目是很贴近我们学习生活的实用项目,有很好的商业前景。 【参与人数】1个队伍 【时间】现在可以开始,结束时间看项目进度。 【要求】会涉及到概率知识。涉及到矩阵。涉及到java/c# |