机器学习和生物信息学实验室联盟

 找回密码
 注册

QQ登录

只需一步,快速开始

搜索
查看: 4422|回复: 7
打印 上一主题 下一主题

libsvm Chih-Jen Lin Some Thoughts on Large-scale Data Classi

  [复制链接]
跳转到指定楼层
楼主
发表于 2012-10-24 15:02:44 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
今天有幸听了Chih-Jen Lin的一场报告,主要关于大数据分类,指出了人们对分类任务认识的一些误区,以及分布式环境(MPI/mapreduce)做分类,未来大数据分类的发展方向,推荐阅读下

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
分享到:  QQ好友和群QQ好友和群 QQ空间QQ空间 腾讯微博腾讯微博 腾讯朋友腾讯朋友
收藏收藏 转播转播 分享分享
回复

使用道具 举报

沙发
发表于 2012-10-24 15:51:14 | 只看该作者
据说Andrew Ng下周要去百度做报告了,羡慕嫉妒恨那
回复 支持 反对

使用道具 举报

板凳
发表于 2012-10-24 19:34:59 | 只看该作者
"A framework is like a language or a specification. You can then have different implementations"

"let problems drive the tools"
回复 支持 反对

使用道具 举报

地板
 楼主| 发表于 2012-10-24 21:45:42 | 只看该作者
chenwq 发表于 2012-10-24 19:34
"A framework is like a language or a specification. You can then have different implementations"

...

反复强调的“Focus on ease of use”
回复 支持 反对

使用道具 举报

5#
 楼主| 发表于 2012-10-24 22:50:05 | 只看该作者
chenwq 发表于 2012-10-24 19:34
"A framework is like a language or a specification. You can then have different implementations"

...

The Hadoop or MapReduce are not designed in particular for machine learning application,and we need know when and where are suitable to be used.Why Hadoop is insufficient for iterative algorithms?It have expensive Disk IO use.
回复 支持 反对

使用道具 举报

6#
发表于 2012-11-22 12:10:33 | 只看该作者
mahout社区曾经就这个问题争论了好久,最后依旧坚持用hadoop hdfs,因为业界广泛应用,spark,puma之类 还很不成熟
ps:求下载
回复 支持 反对

使用道具 举报

7#
 楼主| 发表于 2012-11-23 14:51:44 | 只看该作者
请问是啥问题争论了好久??Spark已有公司在用,国内公司永远比别人慢一拍
回复 支持 反对

使用道具 举报

8#
发表于 2012-11-26 00:35:04 | 只看该作者
大规模机器学习算法的开发非常依赖于并行的计算框架,hadoop当初并不是为了机器学习设计的,有人希望能解耦合,能适应多种下层的计算模式
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

机器学习和生物信息学实验室联盟  

GMT+8, 2024-11-2 03:34 , Processed in 0.073289 second(s), 25 queries .

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表