机器学习和生物信息学实验室联盟

标题: 在WEKA中使用SMOTE对不平衡数据集预处理的步骤 [打印本页]

作者: RockRabbit    时间: 2016-4-11 21:52
标题: 在WEKA中使用SMOTE对不平衡数据集预处理的步骤
对于不平衡的数据集,经特征提取后形成的arff特征文件,要经过一个预处理过程使得数据平衡。

在WEKA中打开原始的arff特征文件,在“Filter”中选择supervised->SMOTE进行过采样。在SMOTE的参数设置中,默认对少数类进行过采样,当然也可以设置对特定类别进行过采样。而如何能够控制不同类的比例呢?则通过SMOTE中的一个参数决定的,即“percentage“,其默认值为100。例如,如果我们设成700,那么就意味着我们增加了7倍少数类的样本量。

参数设置完成后,注意一定要按“apply”按钮,才能完成SMOTE函数中过采样的操作。




欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2