如果邮件中的内容不能正常显示,请点击此处查看   如果不想再收此邮件,可取消订阅
 
  Hadoop与大数据周刊 2015-03-13 第58  
 
  陈超:Spark这一年,从开源到火爆  
2014年的大数据领域,Apache Spark(以下简称Spark)无疑最受瞩目。Spark,出自名门伯克利AMPLab之手,目前由商业公司Databricks保驾护航。自2014年3月份跻身Apache顶级项目(TLP),Spark已然成为ASF最活跃的项目之一,得到了业内广泛的支持——2014年12月发布的Spark 1.2版本包含了来自172位Contributor贡献的1000多个commits。而在2014一整年中,Spark共发布了大小9个版本(包含5月底发布具有里程碑意义的1.0版本),其社区活跃度可见一斑。
 
  构建新一代容器云计算Big Data Platform最佳实践  
Mesos诞生于UC Berkeley的一个研究项目,现已成为Apache中顶级项目,当前业界知名企业已经开始使用Mesos管理集群资源,比如Twitter、AirBnb、爱奇艺等。
 
  Docker的典型应用场景  
相对于VM,docker在其轻量、配置复杂度以及资源利用率方面有着明显的优势。 随着docker技术的不断成熟,越来越多的企业开始考虑通过docker来改进自己的IT系统。
 
  MLlib中的Random Forests和Boosting  
在Spark 1.2中,MLlib引入了Random Forests和Gradient-Boosted Trees(GBTs)。在分类和回归处理上,这两个算法久经验证,同时也是部署最广泛的两个方法。Random Forests和GBTs属于ensemble learning algorithms(集成学习算法),通过组合多个决策树来建立更为强大的模型。
 
  Databricks、Intel、BAT齐聚,2015 Spark峰会火花四射  
在吸引Cloudera、Datastax、 MapR、Pivotal、Hortonworks等众多厂商加入的同时,Spark技术更在Yahoo、eBay、Twitter、Amazon、阿里、腾讯、百度、小米、京东等众多知名国内外企业落地实践。 只一年时间,Spark已实现开源到火爆 ,亦逐渐显露出与通用大数据平台Hadoop的分庭抗争之势。然而作为一个高速发展中的开源项目,其部署过程中存在的门槛和挑战亦不可谓不大。在这个大背景下, 2015 Spark技术峰会将于4月18日适时开启,同期举行的还有OpenStack技术大会与Container技术峰会。
 

  最新公告  
 
  【6折优惠最后3天】OpenCloud 2015:三大峰会同时启动  
OpenCloud 2015将覆盖OpenStack、Spark、Container三大时下最热门的云计算大数据核心技术,荟萃国内外真正的云计算专家。
 
  联系我们  
 
  Hadoop与大数据周刊  
  由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。  
  
  CSDN 移动客户端   CSDN官方微信    
CSDN 移动客户端CSDN官方微信
 
查看Hadoop与大数据周刊往期回顾,更多精彩内容尽在Hadoop个性阅读。欢迎向您的朋友推荐订阅本邮列表。
如果不想再收到该邮件,可以取消订阅