机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 2152|回复: 0
打印 上一主题 下一主题

基于docker快速搭建Hadoop容器集群,方便调试及应用部署

[复制链接]
跳转到指定楼层
楼主
发表于 2016-8-15 14:29:00 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
Hadoop真实集群昂贵,本地搭建主要问题是繁琐,服务器集群主要问题是昂贵。借助alvinhenrick/hadoop-mutinode及东京大学的kiwanlau项目成果,我制作了shixiang/hadoop镜像,增加暴露tomcat端口。它实现了通过docker容器将Hadoop容器集群打包成镜像,减少初学者在集群搭建上的时间花费,最终使Hadoop程序在任意一台机器(尤其是服务器)上都能快速部署,高效运行。因此,如果你有以下需求,不妨尝试:
1. 希望尽快随时随地运行Hadoop程序
2. 希望做一个运行Hadoop程序的网站,但没有服务器集群

一、搭建三节点容器群
1. 拉取docker镜像:sudo docker pull shixiang/hadoop:1.0

2. 克隆Github仓库:git clone https://github.com/ShixiangWan/easy-docker-hadoop

3. 创建Hadoop集群通信网络:sudo docker network create --driver=bridge hadoop

4. 启动容器:cd easy-docker-hadoop; sh start-container.sh

5. 启动Hadoop:sh start-hadoop.sh

6. 运行wordcount:sh run-wordcount.sh

特别说明:
* 镜像中Hadoop版本为2.7.2, 操作系统Ubuntu14.04, Tomcat暴露端口为8090
* 容器默认包含1个主节点,2个从节点
* 容器操作目录位于主节点hadoop-master的/root路径下
* NameNode管理地址: http://localhost:50070/
* ResourceManager管理地址: http://localhost:8088/


二. 搭建任意节点Hadoop容器群
1. 拉取镜像+克隆Github仓库+创建Hadoop集群通信网络:与上面步骤相同

2. 重建Docker镜像: sudo sh resize-cluster.sh 5

3. 启动容器:sudo sh start-container.sh 5

4. 启动Hadoop+运行wordcount:与上面步骤相同

三、Docker常用命令
1.Ubuntu 14.04~16.04 安装docker
  1. sudo apt-get install apt-transport-https
  2. sudo apt-key adv --keyserver hkp://keyserver.ubuntu.com:80 --recv-keys 36A1D7869245C8950F966E92D8576A8BA88D21E9
  3. sudo bash -c "echo deb https://get.docker.io/ubuntu docker main > /etc/apt/sources.list.d/docker.list"
  4. sudo apt-get update
  5. sudo apt-get install lxc-docker
复制代码

2. 查看本地镜像:docker images
3. 查看本地容器:docker ps(查看本地所有容器:docker ps -a)
4. 启动容器:docker start <container_id1> <container_id2>...
5. 关闭容器:docker stop <container_id1> <container_id2>...
6. 进入容器:docker exec -it <container_id> /bin/bash
7. 复制宿主机文件或文件夹至容器:docker cp <local_path> <container_id>:<container_path>
8. 复制容器文件或文件夹至宿主机:docker cp <container_id>:<container_path> <local_path>

easy-docker-hadoop:
Github托管地址:https://github.com/ShixiangWan/easy-docker-hadoop
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-23 04:35 , Processed in 0.066786 second(s), 23 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表