机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 3372|回复: 5
打印 上一主题 下一主题

我理解的Map-Reduce

[复制链接]
跳转到指定楼层
楼主
发表于 2012-2-23 22:09:57 | 只看该作者 回帖奖励 |正序浏览 |阅读模式
整个Map和Reduce就是以<Key,Value>对作为参数进行传递。
Map函数把输入文件读入,转化成<K,V>对。然后hadoop自动进行sort,对同一K的V合并到一个List中。最后Reduce对每一个K整理。

不知道对不对?文瑞来补充:)
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

6#
发表于 2012-2-27 12:10:53 | 只看该作者
xmubingo 发表于 2012-2-27 09:47
再深入,就出现ruidoop。

咱们一起研发一个brdoop
回复 支持 反对

使用道具 举报

5#
发表于 2012-2-27 09:47:13 | 只看该作者
Fth-Hokage 发表于 2012-2-27 09:32
哈哈 也没有 邹老师 我也就懂这些 再往深了去估计也不行了

再深入,就出现ruidoop。
回复 支持 反对

使用道具 举报

地板
发表于 2012-2-27 09:32:38 | 只看该作者
哈哈 也没有 邹老师 我也就懂这些 再往深了去估计也不行了
回复 支持 反对

使用道具 举报

板凳
 楼主| 发表于 2012-2-26 17:29:12 | 只看该作者
Fth-Hokage 发表于 2012-2-26 15:02
嗯 邹老师说的挺全面,简单的来说分为四个阶段:InputFormat/MapTask/Shuffle/ReduceTask
InputFormat:    ...

very goooooooooood

看过hadoop源码的人果然不一般~~~
回复 支持 反对

使用道具 举报

沙发
发表于 2012-2-26 15:02:12 | 只看该作者
嗯 邹老师说的挺全面,简单的来说分为四个阶段:InputFormat/MapTask/Shuffle/ReduceTask
InputFormat:   输入文件 --> 转化 --> <K, V>
MapTask :       <K, V>  --> map处理 --> <K', V'>
Shuffle :         <K', V'> --> Sort and Group --><K', List(V')>
ReduceTask:   <K', List(V')> --> Reduce处理 --> <K'', V''>
从头至尾是以<K, V>为参数在传递~
他的心脏Shuffle完成的Sort and Group主要用到的数据结构/算法是:
环状队列,小根堆 / 快排,堆排序




   
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-27 05:54 , Processed in 0.067845 second(s), 22 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表