机器学习和生物信息学实验室联盟
标题:
在WEKA中使用SMOTE对不平衡数据集预处理的步骤
[打印本页]
作者:
RockRabbit
时间:
2016-4-11 21:52
标题:
在WEKA中使用SMOTE对不平衡数据集预处理的步骤
对于不平衡的数据集,经特征提取后形成的arff特征文件,要经过一个预处理过程使得数据平衡。
在WEKA中打开原始的arff特征文件,在“Filter”中选择supervised->SMOTE进行过采样。在SMOTE的参数设置中,默认对少数类进行过采样,当然也可以设置对特定类别进行过采样。而如何能够控制不同类的比例呢?则通过SMOTE中的一个参数决定的,即“percentage“,其默认值为100。例如,如果我们设成700,那么就意味着我们增加了7倍少数类的样本量。
参数设置完成后,
注意一定要按“apply”按钮
,才能完成SMOTE函数中过采样的操作。
欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/)
Powered by Discuz! X3.2