|
本帖最后由 xmubingo 于 2011-9-2 15:25 编辑
投票的目的就是利用多数占优,少数服从多数的思维。认为多数人的决定应该是正确的,但是也有误判的情况。
假设使用分类器为C1,C2,C3,类别有N类。
(1)从分类结果出发——重写classifyInstance函数判断每个分类器的结果,以获得票数最多的类别作为返回值。
特殊情况:类别得到的票数一样多,这种情况可以读取每个分类器的distributionForInstance概率分布,对每个类别得到的概率值进行简单求和,将值最大的类别作为返回值。
(2)从概率分布出发——重写distributionForInstance函数
不管每个分类器的最终结果是什么。读取每个分类器的distributionForInstance概率分布,对每个类别得到的概率值进行简单求和,作为返回值。
(3)从权重出发——重写distributionForInstance函数
单个分类器进行交叉验证的结果中C3的效果最好,C1,C2次之,那么可以使用0.3 0.3 0.4的权重。
(4)对于多种投票方法的投票
对于多种投票策略得出的结果再进行投票。
大家还有没有别的做法?
|
|