机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 5024|回复: 0
打印 上一主题 下一主题

在WEKA中使用SMOTE对不平衡数据集预处理的步骤

[复制链接]
跳转到指定楼层
楼主
发表于 2016-4-11 21:52:03 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
对于不平衡的数据集,经特征提取后形成的arff特征文件,要经过一个预处理过程使得数据平衡。

在WEKA中打开原始的arff特征文件,在“Filter”中选择supervised->SMOTE进行过采样。在SMOTE的参数设置中,默认对少数类进行过采样,当然也可以设置对特定类别进行过采样。而如何能够控制不同类的比例呢?则通过SMOTE中的一个参数决定的,即“percentage“,其默认值为100。例如,如果我们设成700,那么就意味着我们增加了7倍少数类的样本量。

参数设置完成后,注意一定要按“apply”按钮,才能完成SMOTE函数中过采样的操作。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-26 23:12 , Processed in 0.064233 second(s), 18 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表