如果邮件中的内容不能正常显示,请
点击此处查看
如果不想再收此邮件,可
取消订阅
2014-01-29 第
9
期
学以致用,极客通过大数据搞定女朋友
马上就要过年了,又要回家面对各种七大姑八大姨的催命问题,对广大的宅男极客来说,“找女朋友没有?”已被选为最不受欢迎的一句话了。我们生活在一个充满“数据”的世界,找个女朋友真的很难么?有了“大数据”的帮助,找女朋友的成功率会高很多。且看来自美国的Chris McKinlay给我们分享的经典案例:如何通过大数据找到你的另一半。
可视化,大数据变现的关键途径
David Hoffer是一位出色的设计师,也是Declara公司的UE部门负责人。他认为“大数据”是个既专业又模糊的术语,作为用户没有必要研究它,但如果想使用,就必然要求将它变成“看的见”,最好是“摸得着”的东西。Visua.ly、Google Map、Racial Dot Map还有Kepler Mission等越来越多的可视化成果将带我们走进更加丰富多彩的数据世界。本文是David Hoffer的大数据可视化经验总结。
Stardog 2.1:并发性、内存管理、GC机制带来的扩展性提升
本文来自Clark & Parsia公司的企业博客,作者Kendall Clark是公司总裁,也是创始人之一。据Clark描述,对比之前版本,Stardog 2.1的可扩展性有了质的飞跃(这个进步还不是Clark & Parsia公司刻意为之),其强大的查询性能和数据加载能力大大降低了对硬件的要求,Stardog 2.1在内存和进程管理上改进,满足了对大数据处理的要求,使其即便在更大的数据库中也能有出色的表现。
BDTC2013观后感:Impala和数据挖掘
2013中国大数据技术大会(BDTC 2013)已过去一个月,而梁堰波(@DataScientist)的回顾,再次唤醒了我们对大会的回忆。他对一些主题的分享,以及对于更多技术点的总结与整理,可以帮助我们迅速构建起Hadoop的系统认识。
对比Hadoop,Spark受多方追捧的原因
作者Mikio Braun是柏林工业大学机器学习专业的博士后,他通过描述了自己对Spark逐步认识的过程,为我们剖析了Spark的原理和应用。作为通用的并行处理框架,Spark具有类似Hadoop的一些优点,而且Spark采用了更好的内存管理,在迭代计算上具有比Hadoop更高的效率,Spark还提供了更为广泛的数据集操作类型,大大方便了用户的开发,checkpoint的应用使Spark具有很强容错能力,众多优越的性能和比Hadoop更广泛的适用面让Spark的进一步发展值得期待。
淘宝HBase Bulkload Bug修复及Patch提交经验总结
放眼国内互联网公司,大数据开源应用领域最有经验的无疑非阿里、百度、腾讯等公司莫属,本文将分享淘宝在HBase使用过程中遇到的问题及给出的修复方案。
联系我们
Hadoop与大数据周刊
由CSDN和《程序员》杂志编辑与社区共同打造,涵盖大数据及Hadoop领域,萃取最精华Hadoop与大数据技术内容,每周四发送。
CSDN 移动客户端
CSDN官方微信
查看
Hadoop与大数据周刊往期回顾
,更多精彩内容尽在
Hadoop个性阅读
。欢迎向您的朋友推荐
订阅
本邮列表。
如果不想再收到该邮件,可以
取消订阅