如果邮件中的内容不能正常显示,请点击此处查看   如果不想再收此邮件,可取消订阅
 
  Hadoop与大数据周刊 2015-07-17 第72  
 
  Pinot-LinkedIn如何将大数据做到实时与民主化  
最近Pinot开源的消息广为传播,作为在世界上第一个尝试使用并推广Pinot作为分析型工具的LinkedIn团队,前LinkedIn商务分析部数据工程总监、现任Gorwoingio联合创始人吴继业分享了他们使用Pinot的体会和经验。
 
  MapReduce、Spark、Phoenix、Disco、Mars浅析及性能测试  
当使用Hadoop技术架构集群,集群内新增删除节点,或某个节点机器内硬盘存储达到饱和值时,都会造成集群内数据分布不均匀等问题。本文介绍HDFS内部的数据平衡方式,通过实验案例向读者解释内部数据平衡的解决办法。
 
  深度学习和经验主义的胜利  
现在深度学习在许多监督式机器学习的任务中扮演着领头羊的角色,但很多机器学习研究者并不奉承深度,有些人把深度学习当成了一种时尚。另外,越来越健全的统计学机器学习对今天许多表现最好的算法并没有理论保证。
 
  Spark与Flink:对比与分析  
Spark是一种快速、通用的计算集群系统,Spark提出的最主要抽象概念是弹性分布式数据集(RDD),它是一个元素集合,划分到集群的各个节点上,可以被并行操作。而Flink是可扩展的批处理和流式数据处理的数据处理平台。
 
  阿里云分布式缓存OCS与DB之间的数据一致性  
OCS是阿里巴巴集团的分布式缓存产品,支撑着淘宝、阿里巴巴、支付宝的日常运作,尤其在双11等大型活动上,承载了绝大多数的数据请求。与OCS相比,著名的Memcached具备了分布式集群管理的功能。2014年OCS经历了从分布式到云服务的进化,作为阿里云服务的缓存产品正式商业化。
 
  数据中心配备NVIDIA Tesla K80双芯计算卡可提升10倍计算能力  
NVIDIA Tesla K80采用了两个GK210核心,而GK210本身就是针对高性能计算而设计的,寄存器文件和一级缓存的容量都翻了一番,达到了512KB和128KB,将这款怪物级别的计算卡配置在服务器中将可以提高10倍的计算能力。
 
  Netflix使用的异常服务器侦测技术  
Netflix开发了一个系统来发现服务器之间细微的差别,差别虽然小,但可能就是这些小的地方出问题。本文中Netflix介绍了这一自动异常侦测技术和问题服务器的修复。
 
  Google Kubernetes牵手OpenStack 混合云与容器化谁主宰?  
Google签署协议成为“企业赞助商”级会员,每年将缴纳25,000美元的会费。Google将在Murano应用目录、Magnum容器流程管理服务等一系列开源项目持续贡献工程资源。这使得OpenStack在同一个Dashboard中管理虚拟的、非虚拟的、以及容器应用成为可能。
 
  史上最全容器技术大盘点,没有之一  
容器革命已经来临。Red Hat、IBM、微软和AWS甚至VMware都在关注容器。哪里有最新的技术,哪里就有最热门的初创公司。今天就给大家盘点一下容器领域有哪些最新技术和公司。
 

  联系我们  
 
  Hadoop与大数据周刊  
  由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。  
  
  CSDN 移动客户端   CSDN官方微信    
CSDN 移动客户端CSDN官方微信
 
查看Hadoop与大数据周刊往期回顾,更多精彩内容尽在Hadoop个性阅读。欢迎向您的朋友推荐订阅本邮列表。
如果不想再收到该邮件,可以取消订阅