<?xml version="1.0" encoding="gbk"?>
<rss version="2.0">
  <channel>
    <title>机器学习和生物信息学实验室联盟 - Hadoop分布式计算</title>
    <link>http://123.57.240.48/forum.php?mod=forumdisplay&amp;fid=67</link>
    <description>Latest 20 threads of Hadoop分布式计算</description>
    <copyright>Copyright(C) 机器学习和生物信息学实验室联盟</copyright>
    <generator>Discuz! Board by Comsenz Inc.</generator>
    <lastBuildDate>Mon, 20 Apr 2026 14:02:56 +0000</lastBuildDate>
    <ttl>60</ttl>
    <image>
      <url>http://123.57.240.48/static/image/common/logo_88_31.gif</url>
      <title>机器学习和生物信息学实验室联盟</title>
      <link>http://123.57.240.48/</link>
    </image>
    <item>
      <title>Ubuntu16.04集群下安装JDK1.8+Scala+Hadoop2.7.3+Spark2.0.2</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1385</link>
      <description><![CDATA[为了记录hadoop和spark集群的安装过程，特记录下来供大家参考。

详细过程参见我的博客园：
http://www.cnblogs.com/shixiangwan/p/6159299.html]]></description>
      <category>Hadoop分布式计算</category>
      <author>shixiang</author>
      <pubDate>Sun, 11 Dec 2016 04:33:47 +0000</pubDate>
    </item>
    <item>
      <title>基于docker快速搭建Hadoop容器集群，方便调试及应用部署</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1284</link>
      <description><![CDATA[Hadoop真实集群昂贵，本地搭建主要问题是繁琐，服务器集群主要问题是昂贵。借助alvinhenrick/hadoop-mutinode及东京大学的kiwanlau项目成果，我制作了shixiang/hadoop镜像，增加暴露tomcat端口。它实现了通过docker容器将Hadoop容器集群打包成镜像，减少初学者在集群搭 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>shixiang</author>
      <pubDate>Mon, 15 Aug 2016 06:29:00 +0000</pubDate>
    </item>
    <item>
      <title>Redis，风一样的存储</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1253</link>
      <description><![CDATA[]]></description>
      <category>Hadoop分布式计算</category>
      <author>shixiang</author>
      <pubDate>Wed, 13 Jul 2016 12:01:08 +0000</pubDate>
    </item>
    <item>
      <title>Spark学习资料</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1081</link>
      <description><![CDATA[现在工业界对于Spark内存计算模型追得相当火热，另外也有一部分是相对MapReduce更为灵活的编程接口，目前学习Spark最好的地方还是这几个地方：
官网docs：http://spark.apache.org/documentation.html
邮件列表：http://spark.apache.org/community.html#mailing-list ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>tangzk</author>
      <pubDate>Mon, 29 Sep 2014 15:46:28 +0000</pubDate>
    </item>
    <item>
      <title>Graph lab how to guide 已发布。</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1065</link>
      <description><![CDATA[https://github.com/graphlab-code/how-to 

coding language：python]]></description>
      <category>Hadoop分布式计算</category>
      <author>Mr.Vege求好运</author>
      <pubDate>Sat, 30 Aug 2014 12:59:53 +0000</pubDate>
    </item>
    <item>
      <title>GraphLab 安装试用</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1062</link>
      <description><![CDATA[由于一些需求要安装GraphLab，由此展开环境搭建。
因为用的几乎是纯净的系统，莫名其妙在jdk安装上都出了一堆问题。终于焦头烂额3天之后搞定。
把过程以及遇到的问题截图，为后面的孩子造福利~
但因为是新手，还会有很多不懂或者不对的地方，所以欢迎 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>小妖儿</author>
      <pubDate>Thu, 21 Aug 2014 06:50:57 +0000</pubDate>
    </item>
    <item>
      <title>搭建hadoop单机版环境</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1056</link>
      <description><![CDATA[菜鸟最近想玩玩hadoop，配置单机环境配的吐血啊！！！！ 只怨自己对权限这个问题没有概念。。。。
所以，将单机配置的步骤稍稍总结了一下！]]></description>
      <category>Hadoop分布式计算</category>
      <author>JinjinLi</author>
      <pubDate>Sat, 09 Aug 2014 13:56:25 +0000</pubDate>
    </item>
    <item>
      <title>Spark学习</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1052</link>
      <description><![CDATA[今天读了RDD的论文，感觉还是论文更靠谱，解释的也比较清楚。
参考了陈超的Spark视频以及伯克利实验室的论文中的内容写了一些RDD的相关知识。
总的来说，就一个感受：everything is possible
这个帖子会开成一个系列，争取一周添加一篇新的PDF作为扩展。
另 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>Mr.Vege求好运</author>
      <pubDate>Thu, 31 Jul 2014 15:11:44 +0000</pubDate>
    </item>
    <item>
      <title>在VMWARE10上面配置hadoop2.2.0集群以及spark1.0.1集群</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1049</link>
      <description><![CDATA[因为准备在Spark上跑SVD分解，所以想着先配置一下，
 谁知道...原本装在本机的Ubuntu崩溃了...
索性选择在VMWARE中来配置
花费了一天时间，总算搞定了
因为图文较多，直接放在PDF文档里面了 
这里就PO两张截图吧
：]]></description>
      <category>Hadoop分布式计算</category>
      <author>Mr.Vege求好运</author>
      <pubDate>Mon, 28 Jul 2014 04:40:46 +0000</pubDate>
    </item>
    <item>
      <title>spark 源码剖析</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1036</link>
      <description><![CDATA[刚开始看spark，在码农周刊里看到一个分享的spark源码剖析博客，
有兴趣的小伙伴可以一起看看。
博客地址戳：http://www.cnblogs.com/hseagle/category/569175.html
现看完前两篇，感觉很赞。

还有一个博客，PO主正在连载中，内容相关spark1.0.0 也很系统
地址： ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>Mr.Vege求好运</author>
      <pubDate>Mon, 30 Jun 2014 13:15:44 +0000</pubDate>
    </item>
    <item>
      <title>Spark 学习总结</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=1003</link>
      <description><![CDATA[Spark 学习笔记和总结 ， 分享给大家， 不要问我是谁，叫我红领巾！！
   
   （1） spark 论文：
            （原文）Spark Cluster Computing withWorking Sets
                         
            （学渣只能译一遍才能看懂）活跃数据集上的集群运算
 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>小疯纸一枚</author>
      <pubDate>Wed, 19 Mar 2014 06:42:08 +0000</pubDate>
    </item>
    <item>
      <title>Spark谁用过？写文档有重奖！</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=995</link>
      <description><![CDATA[https://spark.incubator.apache.org/]]></description>
      <category>Hadoop分布式计算</category>
      <author>zouquan</author>
      <pubDate>Tue, 18 Feb 2014 11:29:45 +0000</pubDate>
    </item>
    <item>
      <title>现在hadoop的学习资料多起来了</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=994</link>
      <description><![CDATA[itcast的培训视频貌似有放出来过，pan.baidu.com上次也收到很多学习资料。
要是初学者的话，我觉得可以从看视频开始，再回去看书，这样学起来会轻松一点。
毕业了没有这个时间学喽。]]></description>
      <category>Hadoop分布式计算</category>
      <author>endual</author>
      <pubDate>Sat, 15 Feb 2014 09:34:06 +0000</pubDate>
    </item>
    <item>
      <title>谁来试试MPJ</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=992</link>
      <description><![CDATA[除了MPI还有MPJ，专门为java准备的

http://www.mpj-express.org/

谁试试看，写文档有重奖]]></description>
      <category>Hadoop分布式计算</category>
      <author>zouquan</author>
      <pubDate>Thu, 13 Feb 2014 15:31:21 +0000</pubDate>
    </item>
    <item>
      <title>Hadoop编程实战步步进阶</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=988</link>
      <description><![CDATA[本篇主要是针对Hadoop MapReduce编程的学习整理，涉及针对MapReduce编程常用的编程思路及经典范例，另外也有Hadoop平台相关的内容，但暂时不涉及对Hadoop的底层运行细节的深入。

一、Hadoop编程基础
1.]]></description>
      <category>Hadoop分布式计算</category>
      <author>tangzk</author>
<enclosure url="/forum/Hadoop Job运行基本流程 ★
3." length="Had ..." type="image/jpeg" />      <pubDate>Sun, 12 Jan 2014 07:15:38 +0000</pubDate>
    </item>
    <item>
      <title>Hadoop中使用ArrayWritable作为value的扩展异常处理</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=959</link>
      <description><![CDATA[作为曾经比较早接触Hadoop的一员，现在看到自己都落后大家一个环岛路那么远了，说起来甚是惭愧，因为毕业设计跟这个相关，所以就再次捡起来了，一些写程序中遇到的问题，说来大家分享一下，如果大家都已经碰到这个问题了，并且觉得好弱的问题，就不要喷我了，理解一下作 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>hsc</author>
      <pubDate>Sun, 03 Nov 2013 09:40:30 +0000</pubDate>
    </item>
    <item>
      <title>外校的学生冒个泡</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=956</link>
      <description><![CDATA[我是杨镒铭，在中国科学技术大学，研一，最近也在学习hadoop。]]></description>
      <category>Hadoop分布式计算</category>
      <author>海松</author>
      <pubDate>Sat, 12 Oct 2013 10:54:45 +0000</pubDate>
    </item>
    <item>
      <title>MapReduce算法设计</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=922</link>
      <description><![CDATA[mapreduce区别于以往的编程模式，因此利用mapreduce来实现各类算法显然也是值得书写的内容。推荐两本关于mapreduce算法设计的书籍，给有兴趣在mapreduce算法实现上深入的同学。当然，也要知道，如同我们常见的普通算法一样，这些也将慢慢都变成熟悉mapreduce编程所必备 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>tangzk</author>
      <pubDate>Fri, 14 Jun 2013 12:15:04 +0000</pubDate>
    </item>
    <item>
      <title>MRUnit单元测试使用范例</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=875</link>
      <description><![CDATA[Hadoop版本：1.0.3
MRUnit版本：0.9.0-incubting-hadoop1
JUnit4：4.8.2
注意由于MRUnit目前还处于变动阶段，上面的版本需要与Hadoop版本匹配，如果在运行出现一些意外的情况，有可能是因为版本不兼容导致，请前往：http://mrunit.apache.org/general/downloads.html ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>tangzk</author>
      <pubDate>Thu, 04 Apr 2013 11:28:18 +0000</pubDate>
    </item>
    <item>
      <title>中文版 MapReduce Patterns, Algorithms, and Use Cases</title>
      <link>http://123.57.240.48/forum.php?mod=viewthread&amp;tid=818</link>
      <description><![CDATA[在这篇文章里总结了几种网上或者论文中常见的MapReduce模式和算法，并系统化的解释了这些技术的不同之处。所有描述性的文字和代码都使用了标准hadoop的MapReduce模型，包括Mappers, Reduces, Combiners, Partitioners,和 sorting

这篇博客比较早，可能实践一下体会才 ...]]></description>
      <category>Hadoop分布式计算</category>
      <author>chenwq</author>
      <pubDate>Tue, 05 Feb 2013 02:21:46 +0000</pubDate>
    </item>
  </channel>
</rss>