如果邮件中的内容不能正常显示,请点击此处查看   如果不想再收此邮件,可取消订阅
 
  Hadoop与大数据周刊 2015-04-30 第65  
 
  微博广告推荐中有关Hadoop的那些事  
微博,一个DAU上亿、每日发博量几千万的社交性产品,拥有庞大的数据集。如何高效得从如此规模的数据集中挖掘出有价值的信息,以增强用户粘性,提高信息传播速度,就成了重中之重。因此,我们引入了hadoop 分布式计算平台,对用户数据和内容数据进行分析和挖掘,作为广告推荐的基础。
 
  从特征描述符到深度学习:计算机视觉发展20年  
我们都知道在过去两年(2012-2014年)深度卷积神经网络在目标检测与识别的基准测试中有过辉煌的成绩,所以你可能会问:在此之前的物体识别技术是什么样子?早期识别系统的设计和现代以多层卷积为基础的框架之间的关系是什么?让我们先来回顾一下过去20年里计算机视觉研究中的一些重要理论和方法。
 
  Docker的核心是什么?  
不久前Docker刚刚完成了9500万美元的新一轮投资,市场估值已经达到10亿美金,而到目前为止Docker还没有真正的商业产品,那么为什么Docker这么火呢?针对这个问题,DVM创始人兼CTO王旭给出了专业的解答。
 
  Dockerfile与Docker构建流程解读  
本次讨论主要对docker build的源码流程进行了梳理和解读,并分享了在制作Dockerfile过程中的一些实践经验,包括如何调试、优化和build中的一些要点。另外,还针对现有Dockerfile的不足进行了简要说明,并分享了对于Dockerfile的一些理解。
 
  如何在不同操作系统部署Docker环境  
Docker是一个为开发人员和系统管理员开发、迁移和运行应用程序的平台。应用程序通过Docker打包成Docker Image后,可以实现统一的方式来下载、启动、扩展、删除和迁移,这样方便了应用程序的部署和运维。本文将介绍如何在不同操作系统平台上部署Docker环境的方法。
 
  Spark Streaming作业提交源码分析接收数据篇  
这里从Kafka中接收数据为例进行讲解,研究了Spark Streaming作业提交全过程,包括从外部数据源接收数据,分块,拆分Job。
 
  Project Tungsten:让Spark将硬件性能压榨到极限  
对于Spark来说,通用只是其目标之一,更好的性能同样是其赖以生存的立足之本。北京时间4月28日晚,Databricks在其官方博客上发布了Tungsten项目,并简述了Spark性能提升下一阶段的RoadMap。
 
  数据中心两种常用流量模型运用mininet的实现  
在网络性能评估中一个巨大的挑战就是如何生成真实的网络流量,还好可以通过程序来创造人工的网络流量,通过建立测试环境来模拟真实的状况。本文就以数据中心网络为目标场景,来在mininet仿真环境中尽可能地还原数据中心内部的真实流量情况。
 
  揭秘12306技术改造(三):传统框架云化迁移到内存数据平台  
此篇文章列举不同类型的系统改造迁移到云平台方案,从改造思路探讨,系统框架设计和项目实施的整个迁移过程,供大家参考和交流。
 

  联系我们  
 
  Hadoop与大数据周刊  
  由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。  
  
  CSDN 移动客户端   CSDN官方微信    
CSDN 移动客户端CSDN官方微信
 
查看Hadoop与大数据周刊往期回顾,更多精彩内容尽在Hadoop个性阅读。欢迎向您的朋友推荐订阅本邮列表。
如果不想再收到该邮件,可以取消订阅