机器学习和生物信息学实验室联盟

标题: Spark 学习总结 [打印本页]

作者: 小疯纸一枚    时间: 2014-3-19 14:42
标题: Spark 学习总结
本帖最后由 小疯纸一枚 于 2014-3-20 00:41 编辑

    Spark 学习笔记和总结 , 分享给大家, 不要问我是谁,叫我红领巾!!
   
   (1) spark 论文:
            (原文)Spark Cluster Computing withWorking Sets
                         [attach]1930[/attach]
            (学渣只能译一遍才能看懂)活跃数据集上的集群运算
                         [attach]1931[/attach]

   (2)Spark 安装(参考振坤师兄文档,因为不是我写的不好拿来给大家下载)

   (3)调试Spark 的eclipse环境配置
           [attach]1929[/attach]
           这样就可以在eclipse 上编写和调试scala/spark 程序了

   (4)Spark 案例详解,每个例子都有完整的代码、解析、运行结果
           [attach]1933[/attach]
           包含五个例子 1、文件的读取和过滤
                               2、WordCoutn 统计单词
                               3、TopK计算词频
                               4、SparkJoin连接数据
                               5、逻辑回归
         下面是SparkJoin连接数据程序所使用到的数据集:
          [attach]1934[/attach]
         ratings.dat , movies.dat, users.dat

   (5)  市面上卖的超级贵的几十刀的最新的Spark 教程
       Fast Data Processing with Spark
       Fast Data Processing with Spark 阅读笔记 (还在酝酿中)
  
        
作者: cwc    时间: 2014-3-20 10:34
红领巾你好。
作者: zouquan    时间: 2014-3-20 16:17
奖励300元!
大家多来点这样的帖子!
作者: xmubingo    时间: 2014-4-3 20:35
赞!




欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/) Powered by Discuz! X3.2