如果邮件中的内容不能正常显示,请点击此处查看   如果不想再收此邮件,可取消订阅
 
  Hadoop与大数据周刊 2013-12-04 第1  
 
  深入剖析阿里巴巴云梯YARN集群  
阿里巴巴作为国内使用Hadoop最早的公司之一,已开启了Apache Hadoop 2.0时代。阿里巴巴的Hadoop集群,即云梯集群,分为存储与计算两个模块,计算模块既有MRv1,也有YARN集群,它们共享一个存储HDFS集 群。云梯YARN集群上既支持MapReduce,也支持Spark、MPI、RHive、RHadoop等计算模型。本文将详细介绍云梯YARN集群的 技术实现与发展状况。
 
  Impala:新一代开源大数据分析引擎  
Impala是Cloudera公司主导开发的新型查询系统,它提供SQL语义,能查询存储在Hadoop的HDFS和HBase中的PB级大数据。已有的Hive系统虽然也提供了SQL语义,但由于Hive底层执行使用的是MapReduce引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala的最大特点也是最大卖点就是它的快速。那么Impala如何实现大数据的快速查询呢?
 
  SQL on Hadoop的最新进展及7项相关技术分享  
对于一个工程师或者分析师来说,如何查询和分析TB/PB级别的数据是在大数据时代不可回避的问题。SQL on Hadoop就成为了一个重要的工具。为什么非要把SQL放到Hadoop上? SQL易于使用;那为什么非得基于Hadoop呢?Hadoop架构具备很强的鲁棒性和可扩展性。本文从技术架构和最新进展两个角度分析一下各种SQL on Hadoop产品的优缺点和适用范围。
 
  Kitten:编写和运行Hadoop YARN程序的好帮手  
Kitten是Cloudera数据科学高级总监Josh Wills开发的一组工具,实现了配置和运行YARN应用的模板代码,使开发者可以将更多精力放在应用本身的逻辑上,无需太多考虑Hadoop集群的问题。项目于2012年6月发布。
 
  Hadoop开发商MapR任命CFO,为上市铺平道路  
MapR近日宣布任命Dan Alter为CFO,上市准备基本就绪了。Alter此前曾经担任被思科收购的Meraki的CFO,此前有三次以CFO领导公司顺利上市的经验。
 
  · [PDF] 林战刚:基于Hadoop的低质流量检测
  · [PDF] 王琤:Hadoop Namenode性能诊断及优化

  最新公告  
 
  · 2013中国大数据技术大会专题报道(12月5~6日)
  · 【下期预告】2013中国大数据技术大会精彩讲义汇总
  联系我们  
 
  Hadoop与大数据周刊  
  由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。  
  
  CSDN 移动客户端   CSDN官方微信    
CSDN 移动客户端CSDN官方微信
 
查看Hadoop与大数据周刊往期回顾,更多精彩内容尽在Hadoop个性阅读。欢迎向您的朋友推荐订阅本邮列表。
如果不想再收到该邮件,可以取消订阅