机器学习和生物信息学实验室联盟
标题:
Spark 学习总结
[打印本页]
作者:
小疯纸一枚
时间:
2014-3-19 14:42
标题:
Spark 学习总结
本帖最后由 小疯纸一枚 于 2014-3-20 00:41 编辑
Spark 学习笔记和总结 , 分享给大家, 不要问我是谁,叫我红领巾!!
(1) spark 论文:
(原文)Spark Cluster Computing withWorking Sets
[attach]1930[/attach]
(学渣只能译一遍才能看懂)活跃数据集上的集群运算
[attach]1931[/attach]
(2)Spark 安装(参考振坤师兄文档,因为不是我写的不好拿来给大家下载)
(3)调试Spark 的eclipse环境配置
[attach]1929[/attach]
这样就可以在eclipse 上编写和调试scala/spark 程序了
(4)Spark 案例详解,每个例子都有完整的代码、解析、运行结果
[attach]1933[/attach]
包含五个例子 1、文件的读取和过滤
2、WordCoutn 统计单词
3、TopK计算词频
4、SparkJoin连接数据
5、逻辑回归
下面是SparkJoin连接数据程序所使用到的数据集:
[attach]1934[/attach]
ratings.dat , movies.dat, users.dat
(5) 市面上卖的超级贵的几十刀的最新的Spark 教程
Fast Data Processing with Spark
Fast Data Processing with Spark 阅读笔记 (还在酝酿中)
作者:
cwc
时间:
2014-3-20 10:34
红领巾你好。
作者:
zouquan
时间:
2014-3-20 16:17
奖励300元!
大家多来点这样的帖子!
作者:
xmubingo
时间:
2014-4-3 20:35
赞!
欢迎光临 机器学习和生物信息学实验室联盟 (http://123.57.240.48/)
Powered by Discuz! X3.2