机器学习和生物信息学实验室联盟

标题: ELKI,又一个Java的数据挖掘平台 [打印本页]

作者: zouquan    时间: 2012-2-1 19:40
标题: ELKI,又一个Java的数据挖掘平台
WEKA、ELKI、Rapid-I,谁能比较一下?

ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。

ELKI也是类似于weka的数据挖掘平台,用java编写,有GUI图形界面。可以用来寻找离群点。

1.获得ELKI的release0.4和一份测试数据mouse.csv
Release0.4下载网址http://elki.dbs.ifi.lmu.de/wiki/Releases,点击最新的executable archive;
mouse.csv 下载网址 http://elki.dbs.ifi.lmu.de/wiki/DataSets,选择csv格式下载;

2.运行命令窗口,进入elki.jar的下载目录,输入java -jar elki.jar,然后就会出现elki的界面;



3.横栏的颜色表示:绿色表示可选;棕色表示有默认值;橘色表示必须设置;

4.设置完参数,点击第一列,错误与否,横栏颜色发生相应变化;注意如果切换算法或者设置的话,前一轮的参数设置不会自动去除,要下拉到最后一行(一般为红色),自行点击横栏删除;
5.一般算法会有参数提示,操作(1)选择算法,点击第一列;(2)在白框部分会有参数设置提示(其实是一种警告方式);

6.主要设置
dbc.in:输入的数据文件;
parser.colsep:数据文件的分割符,如‘,’或者‘\s’;
algorithm:算法(以及相依算法的参数);
evaluator:选择一些评估方式;
resulthandler:以什么方式显示结果,默认是图形显示,可以设置成ResultWriter(输出文件)等;

7.如果所有参数都设置正确了,Run Task按钮会被激活,就能运行。

8.注意事项
(1)elki数据集的id起始于1,weka数据集的实例编号起始于0;
(2)elki编程过程要设置分隔符,默认的分隔符是‘\s’,而一些数据的分隔符是‘,’;
(3)如果使用elki的UI界面,最好将数据文件通过weka转换成.CSV文件。

如果要获得elki更多的相关信息,可以进入http://elki.dbs.ifi.lmu.de/

感谢 @邱诚 同学撰写。




欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2