机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 2663|回复: 4
打印 上一主题 下一主题

将XML文件解析成CSV(excel)文件

[复制链接]
跳转到指定楼层
楼主
发表于 2013-12-17 12:49:50 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 wangzhen 于 2013-12-17 12:48 编辑

问题:
         数据库中下载了集成多种蛋白质信息(名称、序列、亚细胞位点等等)的XML文件,现将XML文件解析成标准csv(excel)格式文件。

方法:
         jar文件: ReadXml.jar
         输入:待处理的XML文件:LOCATE_human_v6_20081121.xml(此文件必须放在一个文件夹内,本例为D:\XML文件夹,并且此文件夹只有这个待处理文件)
         输出:CSV文件: LOCATE_protein.csv(提前新建一个文件夹output,csv文件会生成在output文件夹中)

         打开dos命令窗口,一直cd到ReadXml.jar文件存放的文件夹(以桌面为例),输入命令java -jar -Xmn16m -Xms64m -Xmx8000m ReadXml.jar D:\XML output   (其中:-Xmn16m -Xms64m -Xmx8000m指令是JVM内存修改,根据自己的情况修改大小或不写。见下图解释)
如下图所示:

图中:
        红色框内为修改JVM堆内存指令(我将Xmx修改成了8000m,之前修改成4000m仍然失败。待处理文件627m,本人电脑内存16G,可根据个人情况自行设置,否则会出现java.lang.OutOfMemoryError: Java heap space错误!)
        黄色框内的文件夹output(输出文件.csv文件所在的文件夹)是提前新建好的,其存放路径必须与ReadXml.jar存放路径相同!
      
        注意!!指令中输入、输出参数必须是存放输入输出文件的文件夹,而并非输入输出文件!!



代码是胡世昌师兄写的,并交我如何使用,谢胡哥~
现将用法总结如上,供大家学习~

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
发表于 2013-12-17 15:54:59 | 只看该作者
哈哈,整天整点几k几m的有啥意思?

不干点大活儿,都对不起我的16G内存电脑
回复 支持 反对

使用道具 举报

板凳
发表于 2013-12-17 16:03:57 | 只看该作者
PS:我名字给我写错了
另外,这个程序很早之前写的,当时只是为了方便,所以里边很多东西都是按照最简单的方式来处理的,小打小闹可以,如果是需要正规一点的,还是谨慎一点使用,先mark一下,待我论文写完,给写一个可定制功能的版本的!
回复 支持 反对

使用道具 举报

地板
 楼主| 发表于 2013-12-18 09:39:21 | 只看该作者
zouquan 发表于 2013-12-17 15:54
哈哈,整天整点几k几m的有啥意思?

不干点大活儿,都对不起我的16G内存电脑

惭愧惭愧...努力努力
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2013-12-18 09:40:29 | 只看该作者
hsc 发表于 2013-12-17 16:03
PS:我名字给我写错了
另外,这个程序很早之前写的,当时只是为了方便,所以里边很多东西都是按照最 ...

不好意思啦。。。
期待高版本诞生~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-1 11:45 , Processed in 0.071985 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表