机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 6130|回复: 0
打印 上一主题 下一主题

ELKI,又一个Java的数据挖掘平台

[复制链接]
跳转到指定楼层
楼主
发表于 2012-2-1 19:40:39 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
WEKA、ELKI、Rapid-I,谁能比较一下?

ELKI(Environment for Developing KDD-Applications Supported by Index-Structures)主要用来聚类和找离群点。

ELKI也是类似于weka的数据挖掘平台,用java编写,有GUI图形界面。可以用来寻找离群点。

1.获得ELKI的release0.4和一份测试数据mouse.csv
Release0.4下载网址http://elki.dbs.ifi.lmu.de/wiki/Releases,点击最新的executable archive;
mouse.csv 下载网址 http://elki.dbs.ifi.lmu.de/wiki/DataSets,选择csv格式下载;

2.运行命令窗口,进入elki.jar的下载目录,输入java -jar elki.jar,然后就会出现elki的界面;



3.横栏的颜色表示:绿色表示可选;棕色表示有默认值;橘色表示必须设置;

4.设置完参数,点击第一列,错误与否,横栏颜色发生相应变化;注意如果切换算法或者设置的话,前一轮的参数设置不会自动去除,要下拉到最后一行(一般为红色),自行点击横栏删除;
5.一般算法会有参数提示,操作(1)选择算法,点击第一列;(2)在白框部分会有参数设置提示(其实是一种警告方式);

6.主要设置
dbc.in:输入的数据文件;
parser.colsep:数据文件的分割符,如‘,’或者‘\s’;
algorithm:算法(以及相依算法的参数);
evaluator:选择一些评估方式;
resulthandler:以什么方式显示结果,默认是图形显示,可以设置成ResultWriter(输出文件)等;

7.如果所有参数都设置正确了,Run Task按钮会被激活,就能运行。

8.注意事项
(1)elki数据集的id起始于1,weka数据集的实例编号起始于0;
(2)elki编程过程要设置分隔符,默认的分隔符是‘\s’,而一些数据的分隔符是‘,’;
(3)如果使用elki的UI界面,最好将数据文件通过weka转换成.CSV文件。

如果要获得elki更多的相关信息,可以进入http://elki.dbs.ifi.lmu.de/

感谢 @邱诚 同学撰写。
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-2 11:37 , Processed in 0.069604 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表