如果邮件中的内容不能正常显示,请
点击此处查看
如果不想再收此邮件,可
取消订阅
2013-12-04 第
1
期
深入剖析阿里巴巴云梯YARN集群
阿里巴巴作为国内使用Hadoop最早的公司之一,已开启了Apache Hadoop 2.0时代。阿里巴巴的Hadoop集群,即云梯集群,分为存储与计算两个模块,计算模块既有MRv1,也有YARN集群,它们共享一个存储HDFS集 群。云梯YARN集群上既支持MapReduce,也支持Spark、MPI、RHive、RHadoop等计算模型。本文将详细介绍云梯YARN集群的 技术实现与发展状况。
Impala:新一代开源大数据分析引擎
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。那么Impala如何实现大数据的快速查询呢?
SQL on Hadoop的最新进展及7项相关技术分享
对于一个工程师或者分析师来说,如何查询和分析TB/PB级别的数据是在大数据时代不可回避的问题。SQL on Hadoop就成为了一个重要的工具。为什么非要把SQL放到Hadoop上? SQL易于使用;那为什么非得基于Hadoop呢?Hadoop架构具备很强的鲁棒性和可扩展性。本文从技术架构和最新进展两个角度分析一下各种SQL on Hadoop产品的优缺点和适用范围。
Kitten:编写和运行Hadoop YARN程序的好帮手
Kitten是Cloudera数据科学高级总监Josh Wills开发的一组工具,实现了配置和运行YARN应用的模板代码,使开发者可以将更多精力放在应用本身的逻辑上,无需太多考虑Hadoop集群的问题。项目于2012年6月发布。
Hadoop开发商MapR任命CFO,为上市铺平道路
MapR近日宣布任命Dan Alter为CFO,上市准备基本就绪了。Alter此前曾经担任被思科收购的Meraki的CFO,此前有三次以CFO领导公司顺利上市的经验。
·
[PDF] 林战刚:基于Hadoop的低质流量检测
·
[PDF] 王琤:Hadoop Namenode性能诊断及优化
最新公告
·
2013中国大数据技术大会专题报道(12月5~6日)
·
【下期预告】2013中国大数据技术大会精彩讲义汇总
联系我们
Hadoop与大数据周刊
由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。
CSDN 移动客户端
CSDN官方微信
查看
Hadoop与大数据周刊往期回顾
,更多精彩内容尽在
Hadoop个性阅读
。欢迎向您的朋友推荐
订阅
本邮列表。
如果不想再收到该邮件,可以
取消订阅