|
|
|
2014-11-07 第44期 |
|
|
|
Spark vs. MapReduce 时间节约66%,计算节约40% |
|
MapReduce为大数据挖掘提供了有力的支持,但是复杂的挖掘算法往往需要多个MapReduce作业才能完成,多个作业之间存在着冗余的磁盘读写开销和多次资源申请过程,使得基于MapReduce的算法实现存在严重的性能问题。后起之秀Spark得益于其在迭代计算和内存计算上的优势,可以自动调度复杂的计算任务,避免中间结果的磁盘读写和资源申请过程,非常适合数据挖掘算法。 |
|
|
专访Databricks辛湜,谈Spark排序比赛摘冠及生态圈热点 |
|
最新消息,Databricks的Spark与UCSD的TritonSort两个系统在2014 Daytona GraySort比赛上并列第一。为了对比赛有更好的了解,笔者特采访了Databricks 辛湜(Reynold Xin),并就Spark社区中的一些热门趋势进行探讨。 |
|
|
BDTC 2014中国大数据大调查 |
|
2014中国大数据行业大调查将全方位洞察当下大数据生态圈,了解大数据平台开发者的需求,分析大数据行业发展趋势及产品方向,为大数据技术从业者和创业者们提供参考。希望能够得到您的支持与合作,我们将从参与者中抽取幸运用户赠送丰厚大奖。 |
|
|
|
Hadoop与大数据周刊 |
|
|
由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。 |
|
|
CSDN 移动客户端 |
|
CSDN官方微信 |
|
|
|
|
|
|
|
|