|
2014中国大数据行业调查报告 |
|
从11月7日到12月7日,来自全国各地3326位热心用户参与了2014中国大数据行业大调查。报告显示,32.5%的公司正在搭建大数据平台,处于测试阶段;29.5%的公司已经在生产环境实践大数据,并有成功的用例/产品;24.5%的公司已经做了足够的了解,开发准备就绪;基本不了解的只占3000+用户的13.5%。 |
|
|
Facebook的数据仓库是如何扩展到300PB的 |
|
Facebook在数据仓库上遇到的存储可扩展性的挑战是独一无二的,基于Hive的数据仓库中存储了超过300PB的数据,并且以每日新增600TB的速度增长。在提高数据仓库的存储效率方面Facebook也有许多创新点,例如建立冷数据存储的数据中心、对HDFS采用类似RAID的技术在保证数据高可用性不变的前提下降低冗余率、在数据被写入到HDFS之前先做压缩以减少数据占用的存储空间。 |
|
|
构建一个高可用及自动发现的Docker基础架构 |
|
Docker的发展前景一片大好。但在企业当中,如何选择适合自己的Docker构建方案?Kubernetes与CoreOS等整合了各个组件的方案是其中之一,另外一种方案为Haproxy+etcd+confd,采用松散式的组织结构,但各个组件之间的通讯是非常严密的,且扩展性更强,定制也更加灵活。本文详细介绍了如何构建一个高可用及自动发现的Docker基础架构。 |
|
|
值得mark的11个开源机器学习项目 |
|
垃圾邮件过滤、人脸识别、推荐引擎——当你有一个大数据集并且希望利用它们执行预测分析和模式识别,机器学习是必经之路。本文列举了11个机器学习的开源项目中,无论你是Java爱好者还是Python狂人,都可以找到自己想要的项目。
|
|
|
这九大技术将在2015年或未来大行其道 |
|
科技正在以不可思议的速度向前发展,本文预测的9大技术将在2015年或未来对我们产生深远影响。无论是Docker容器还是机器学习,开源都是未来的一大趋势,也是企业获得竞争优势的首选。作为开发人员应该关注技术热点,并围绕核心技术构建一个类似Docker、Hadoop的生态系统。 |
|