|
chenwq 发表于 2013-1-6 11:46
"Big data is like teenage sex. If you do it, you do it bad, and most teenagers just talk about it. ...
哈哈 这个见解真是一针见血
当前大数据主要从三个层析展开:
这三个层析的发展依次对应着云的 SaaS, PaaS, IaaS
其中底层硬件基础架构主要由intel包揽:“英特尔的智能加速技术将使得基于英特尔的服务器平台,能获得优于竞争对手的表现。其次,大量的超线程已经在服务器上被广泛地应用,在集群系统当中使整个集群有更快的互联互通,超级互联架构能够也能使整个集成性能大幅度提高。英特尔最新的存储架构也是对今后可扩展性的存储架构提供了支撑。”
对于中间层和最上层,林智仁 在百度做关于大数据 分类de 演讲时说:“当下诞生的分布式系统或框架--尤其hadoop,并不是为机器学习算法而诞生的,因此很多机器学习算法在这些框架上的并行化并不能达到最佳效果”“那么解决途径就是 1. 致力于新的更适合于机器学习的系统的研究 2. 设计新的能很好适应当前这些框架的算法”
所以,目前除了intel能把重心放在底层外,业界其他很多机构都是重在 中间一层 的研发,我们看看典型的例子:google—pregel, CMU—GraphLab, CRMI—BC-BSP, 华为新成立的诺亚方舟 实验室 其中一个重心也是“研发适合机器学习算法的分布式框架”,还有HaLoop, Graphbuilder, HTC DATA CENTEL LAB也在开发适应于大数据的并行框架
当然 对于上层数据智能 了解的不太多 欢迎大家纠正,完善这几句 闲扯
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有帐号?注册
x
|