机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 3049|回复: 3
打印 上一主题 下一主题

Spark 学习总结

[复制链接]
跳转到指定楼层
楼主
发表于 2014-3-19 14:42:08 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
本帖最后由 小疯纸一枚 于 2014-3-20 00:41 编辑

    Spark 学习笔记和总结 , 分享给大家, 不要问我是谁,叫我红领巾!!
   
   (1) spark 论文:
            (原文)Spark Cluster Computing withWorking Sets
                        
            (学渣只能译一遍才能看懂)活跃数据集上的集群运算
                        

   (2)Spark 安装(参考振坤师兄文档,因为不是我写的不好拿来给大家下载)

   (3)调试Spark 的eclipse环境配置
           
           这样就可以在eclipse 上编写和调试scala/spark 程序了

   (4)Spark 案例详解,每个例子都有完整的代码、解析、运行结果
           
           包含五个例子 1、文件的读取和过滤
                               2、WordCoutn 统计单词
                               3、TopK计算词频
                               4、SparkJoin连接数据
                               5、逻辑回归
         下面是SparkJoin连接数据程序所使用到的数据集:
         
         ratings.dat , movies.dat, users.dat

   (5)  市面上卖的超级贵的几十刀的最新的Spark 教程
       Fast Data Processing with Spark
       Fast Data Processing with Spark 阅读笔记 (还在酝酿中)
  
        

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
发表于 2014-3-20 10:34:23 | 只看该作者
红领巾你好。
回复 支持 反对

使用道具 举报

板凳
发表于 2014-3-20 16:17:53 | 只看该作者
奖励300元!
大家多来点这样的帖子!
回复 支持 反对

使用道具 举报

地板
发表于 2014-4-3 20:35:15 | 只看该作者
赞!
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-5-19 13:38 , Processed in 0.067822 second(s), 18 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表