机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 3656|回复: 2
打印 上一主题 下一主题

Hadoop没学会,又出Haloop,情何以堪啊

[复制链接]
跳转到指定楼层
楼主
发表于 2011-9-16 17:56:39 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Hadoop的成功,让人们看到了使用普通商业集群处理大规模数据的合理性和必要性。
但是,目前在使用Hadoop处理数据的过程中,发现一些应用在处理迭代计算的过程中,例如机器学习、数据挖掘、网页排名等应用的过程中,Hadoop的MR框架有一定的不足。
不足主要存在于:
hadoop的中间数据要存储在本地磁盘,我们迭代的时候,存在本地磁盘的数据并没有变化,只是I/O,频繁的I/O降低了系统的性能。

在需求的驱动下,HaLoop提出了:
1 扩展mapreduce,支持迭代计算的编程模型。
2 使得任务调度对于跌倒操作敏感。
3 将loop-invariant data放在reduce节点的cache上,提升性能。

HaLoop的arch:


一个master node,多个slave nodes。
jobs通过不同的clients发送到master节点,master节点控制作业的执行、调度,并把作业转换成在各个slave节点上执行的并行或者序列化的任务。
HaLoop的最大的特点是:Loop-Aware task scheduleing

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
发表于 2011-9-16 20:21:59 | 只看该作者
哇 技术更新的真是快啊 不变的就是变化啊
回复 支持 反对

使用道具 举报

板凳
发表于 2011-9-17 08:45:52 | 只看该作者
听起来好难,学起来不知道怎么样哈~
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-23 13:08 , Processed in 0.139816 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表