<?xml version="1.0" encoding="gbk"?>
<rss version="2.0">
  <channel>
    <title>机器学习和生物信息学实验室联盟 - 数据挖掘</title>
    <link>http://123.57.240.48/forum.php?mod=forumdisplay&amp;fid=48</link>
    <description>Latest 20 threads of 数据挖掘</description>
    <copyright>Copyright(C) 机器学习和生物信息学实验室联盟</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Mon, 20 Apr 2026 13:44:38 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>http://123.57.240.48/static/image/common/logo_88_31.gif</url>
      <title>机器学习和生物信息学实验室联盟</title>
      <link>http://123.57.240.48/</link>
    </image>
    <item>
      <title>使用MXNet远程编写卷积神经网络用于多标签分类</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1430</link>
      <description><![CDATA[最近试试深度学习能做点什么事情。MXNet是一个与Tensorflow类似的开源深度学习框架，在GPU显存利用率上效率高，比起Tensorflow显著节约显存，并且天生支持分布式深度学习，单机多卡、多机多卡支持丰富，拥有着良好的技术架构。目前是亚马逊AWS的官方深度学习框架。由于 ...]]></description>
      <category>数据挖掘</category>
      <author>shixiang</author>
      <pubDate>Tue, 14 Mar 2017 12:33:05 +0000</pubDate>
    </item>
    <item>
      <title>关于文本分类的简单处理</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1261</link>
      <description><![CDATA[今天看了以往不知道什么时候写的处理文本的一些代码，记录下来，希望对大家有用。 
       文本分类，简单的就拿反作弊来说。
       用户发的帖子有时候会包括一些广告，招聘，不健康等内容，我们需要想个办法把这些垃圾帖（spam）干掉，那么帖子有 spam 和  ...]]></description>
      <category>数据挖掘</category>
      <author>guojiasheng</author>
      <pubDate>Thu, 21 Jul 2016 06:15:52 +0000</pubDate>
    </item>
    <item>
      <title>skfeature使用文档</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1260</link>
      <description><![CDATA[skfeature是一个集成了多种特征选择算法的包，基于python语言写的。

官方网址：http://featureselection.asu.edu/

我针对一个用例，使用Fisher Score对数据集进行了特征选择，具体操作可参见附件的使用文档。

在skfeature中包含了多种特征选择算法，具体有哪些 ...]]></description>
      <category>数据挖掘</category>
      <author>RockRabbit</author>
      <pubDate>Wed, 20 Jul 2016 14:14:05 +0000</pubDate>
    </item>
    <item>
      <title>Splider，基于matlab的WEKA</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1258</link>
      <description><![CDATA[http://people.kyb.tuebingen.mpg.de/spider/main.html
哪位同学能尝试用一下？我有奖。]]></description>
      <category>数据挖掘</category>
      <author>zouquan</author>
      <pubDate>Wed, 20 Jul 2016 01:23:46 +0000</pubDate>
    </item>
    <item>
      <title>关于EML（Extreme learning machine ）</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1224</link>
      <description><![CDATA[上来先发个官方参照链接：http://www.ntu.edu.sg/home/egbhuang/index.html#

             中文叫： 极限学习机。  理论性的东西就参照链接去看吧，我也就大概看了一下，我也解析不清楚。
]]></description>
      <category>数据挖掘</category>
      <author>guojiasheng</author>
<enclosure url="http://123.57.240.48/data/attachment/forum/
             那还是大致说一下吧，错了请指正：
" length="   （1 ..." type="image/jpeg" />      <pubDate>Thu, 02 Jun 2016 13:43:26 +0000</pubDate>
    </item>
    <item>
      <title>利用网格法以F-score为修正指标优化libsvm中c和g--------MATLAB程序</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1221</link>
      <description><![CDATA[1、程序思想，考虑到样本的不平衡，参考F-score的值进行寻优。
2、关于F-score的概念参考：http://bbs.malab.cn/forum.php?mod=viewthread&amp;tid=418&amp;extra=page%3D4
3、首先利用全部样本的2/3作为优化c，g的训练样本的测试样本，剩下的1/3做3折交叉验证。（根据自己 ...]]></description>
      <category>数据挖掘</category>
      <author>jianglimin</author>
      <pubDate>Fri, 27 May 2016 01:43:14 +0000</pubDate>
    </item>
    <item>
      <title>收集机器学习开源软件的网站</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1213</link>
      <description><![CDATA[http://jmlr.csail.mit.edu/mloss/]]></description>
      <category>数据挖掘</category>
      <author>zouquan</author>
      <pubDate>Sun, 24 Apr 2016 09:54:00 +0000</pubDate>
    </item>
    <item>
      <title>PCVMs--使用方法（分类器）</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1202</link>
      <description><![CDATA[Probabilistic Classification Vector Machine (PCVM):
     大概说明一下这个东西，我也没怎么研究过，不过要有拿来主义的精神，会用就好！
具体大家可以到这个网站查看：
]]></description>
      <category>数据挖掘</category>
      <author>guojiasheng</author>
      <pubDate>Fri, 11 Mar 2016 09:35:09 +0000</pubDate>
    </item>
    <item>
      <title>常用的不平衡分类数据处理方法</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1178</link>
      <description><![CDATA[正反例不平衡的分类问题，可以有不少策略，如：
1. 对反例分块，每一块和正例组成一个平衡的数据集，用不同的分类器建model，最后投票；
Ref: Li Song, Dapeng Li, Xiangxiang Zeng, Yunfeng Wu, Li Guo, Quan Zou. nDNA-prot: Identification of DNA-binding Protein ...]]></description>
      <category>数据挖掘</category>
      <author>zouquan</author>
      <pubDate>Wed, 11 Nov 2015 07:40:22 +0000</pubDate>
    </item>
    <item>
      <title>PCA彻头彻尾的解释分析</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1161</link>
      <description><![CDATA[实现PCA的主要流程：
假设数据矩阵是m×n维的，m是样本数，n是特征的维度，目标是对数据进行降维，使其变成m×k维, k]]></description>
      <category>数据挖掘</category>
      <author>wangjingjing</author>
      <pubDate>Tue, 06 Oct 2015 13:15:44 +0000</pubDate>
    </item>
    <item>
      <title>第二届中国大数据技术创新大赛</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1078</link>
      <description><![CDATA[]]></description>
      <category>数据挖掘</category>
      <author>tangzk</author>
      <pubDate>Tue, 23 Sep 2014 11:28:15 +0000</pubDate>
    </item>
    <item>
      <title>cuda-convnet 安装</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1073</link>
      <description><![CDATA[]]></description>
      <category>数据挖掘</category>
      <author>小疯纸一枚</author>
      <pubDate>Sat, 13 Sep 2014 05:21:52 +0000</pubDate>
    </item>
    <item>
      <title>提到机器学习你应该马上就想起的数学</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1044</link>
      <description><![CDATA[题目是我随便取的，这里主要是为发个链接（http://www.cs.cmu.edu/~aarti/Class/10701_Spring14/Intro_ML_Self_Evaluation.pdf），然后小点个人废话。
链接中提到了至少要有三门课的基础，分别是：高等数学、线性代数、概率论与数理统计，是不是感觉很熟悉，当年大学和 ...]]></description>
      <category>数据挖掘</category>
      <author>tangzk</author>
      <pubDate>Thu, 10 Jul 2014 09:28:59 +0000</pubDate>
    </item>
    <item>
      <title>关注2014 Machine Learning Summer School</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1034</link>
      <description><![CDATA[部分slide已经放出来了：
http://lamda.nju.edu.cn/conf/mlss2014/
http://lamda.nju.edu.cn/conf/mlss2014/Program

Xiaojin (Jerry) Zhu  图模型的大牛，如果听过我讲lda的组会，对他的slide应该有印象
Kai Yu 
Yoshua Bengio
Ruslan Salakhutdinov
都是深度 ...]]></description>
      <category>数据挖掘</category>
      <author>xmubingo</author>
      <pubDate>Tue, 17 Jun 2014 08:42:52 +0000</pubDate>
    </item>
    <item>
      <title>级联分类器和简单投票分类器</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1016</link>
      <description><![CDATA[写了点，发现没他说的好，直接贴这篇文章地址：

AdaBoost中利用Haar特征进行人脸识别算法分析与总结1——Haar特征与积分图


主要是讲AdaBoost在人脸识别中的运用，有时候也在CV其他领域。我们经常把多个弱分类器搞成一个强分类器，同样，多个这样的强分类器也可 ...]]></description>
      <category>数据挖掘</category>
      <author>xmubingo</author>
      <pubDate>Wed, 30 Apr 2014 02:40:37 +0000</pubDate>
    </item>
    <item>
      <title>CCDM 2014 数据挖掘竞赛参赛记录</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=997</link>
      <description><![CDATA[]]></description>
      <category>数据挖掘</category>
      <author>chenwq</author>
      <pubDate>Sun, 23 Feb 2014 08:14:25 +0000</pubDate>
    </item>
    <item>
      <title>一个有趣的分类任务</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=972</link>
      <description><![CDATA[]]></description>
      <category>数据挖掘</category>
      <author>xmubingo</author>
      <pubDate>Thu, 05 Dec 2013 04:38:48 +0000</pubDate>
    </item>
    <item>
      <title>请问对论坛主题进行实时分析该用什么方法</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=954</link>
      <description><![CDATA[工作闲来无聊，突然想做这么一个分析系统。

需求：对论坛进行数据爬取，然后分析得出现阶段论坛的主题、关键词等。

这是不是属于文本分析范围？ 请问有什么资料可以推荐下，有什么思路，谢谢。
目前会用的就是weka，libsvm这些传统的工具。

但是weka在数据量 ...]]></description>
      <category>数据挖掘</category>
      <author>endual</author>
      <pubDate>Thu, 10 Oct 2013 09:08:31 +0000</pubDate>
    </item>
    <item>
      <title>Ranking SVM</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=945</link>
      <description><![CDATA[Ranking SVM是一种Pairwise的排序算法, 给定查询q, 文档d1&gt;d2&gt;d3(亦即文档d1比文档d2相关, 文档d2比文档d3相关, x1, x2, x3分别是d1, d2, d3的特征)。为了使用机器学习的方法进行排序，我们将排序转化为一个分类问题。我们定义新的训练样本, 令x1-x2, x1-x3, x2-x3为正 ...]]></description>
      <category>数据挖掘</category>
      <author>hllysx</author>
      <pubDate>Sat, 14 Sep 2013 07:57:43 +0000</pubDate>
    </item>
    <item>
      <title>论文笔记-A discriminative approach to topic-based citation recommendation</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=927</link>
      <description><![CDATA[Tang, J., &amp; Zhang, J. (2009). A discriminative approach to topic-based citation recommendation. Advances in Knowledge Discovery and Data Mining (pp. 572–579). Springer.
作者介绍：唐杰，清华大学知识工程实验室副教授，在社交网络挖掘领域很有影响力，网 ...]]></description>
      <category>数据挖掘</category>
      <author>tangzk</author>
      <pubDate>Sat, 22 Jun 2013 08:45:08 +0000</pubDate>
    </item>
  </channel>
</rss>