Hadoop与大数据周刊-CSDN 第9期

如果邮件中的内容不能正常显示，请点击此处查看

如果不想再收此邮件，可取消订阅


		2014-01-29 第9期

	学以致用，极客通过大数据搞定女朋友
	马上就要过年了，又要回家面对各种七大姑八大姨的催命问题，对广大的宅男极客来说，“找女朋友没有？”已被选为最不受欢迎的一句话了。我们生活在一个充满“数据”的世界，找个女朋友真的很难么？有了“大数据”的帮助，找女朋友的成功率会高很多。且看来自美国的Chris McKinlay给我们分享的经典案例：如何通过大数据找到你的另一半。

	可视化，大数据变现的关键途径
	David Hoffer是一位出色的设计师，也是Declara公司的UE部门负责人。他认为“大数据”是个既专业又模糊的术语，作为用户没有必要研究它，但如果想使用，就必然要求将它变成“看的见”，最好是“摸得着”的东西。Visua.ly、Google Map、Racial Dot Map还有Kepler Mission等越来越多的可视化成果将带我们走进更加丰富多彩的数据世界。本文是David Hoffer的大数据可视化经验总结。

	Stardog 2.1：并发性、内存管理、GC机制带来的扩展性提升
	本文来自Clark & Parsia公司的企业博客，作者Kendall Clark是公司总裁，也是创始人之一。据Clark描述，对比之前版本，Stardog 2.1的可扩展性有了质的飞跃（这个进步还不是Clark & Parsia公司刻意为之），其强大的查询性能和数据加载能力大大降低了对硬件的要求，Stardog 2.1在内存和进程管理上改进，满足了对大数据处理的要求，使其即便在更大的数据库中也能有出色的表现。

	BDTC2013观后感：Impala和数据挖掘
	2013中国大数据技术大会（BDTC 2013）已过去一个月，而梁堰波（@DataScientist）的回顾，再次唤醒了我们对大会的回忆。他对一些主题的分享，以及对于更多技术点的总结与整理，可以帮助我们迅速构建起Hadoop的系统认识。

	对比Hadoop，Spark受多方追捧的原因
	作者Mikio Braun是柏林工业大学机器学习专业的博士后，他通过描述了自己对Spark逐步认识的过程，为我们剖析了Spark的原理和应用。作为通用的并行处理框架，Spark具有类似Hadoop的一些优点，而且Spark采用了更好的内存管理，在迭代计算上具有比Hadoop更高的效率，Spark还提供了更为广泛的数据集操作类型，大大方便了用户的开发，checkpoint的应用使Spark具有很强容错能力，众多优越的性能和比Hadoop更广泛的适用面让Spark的进一步发展值得期待。

	淘宝HBase Bulkload Bug修复及Patch提交经验总结
	放眼国内互联网公司，大数据开源应用领域最有经验的无疑非阿里、百度、腾讯等公司莫属，本文将分享淘宝在HBase使用过程中遇到的问题及给出的修复方案。

联系我们


	Hadoop与大数据周刊
	由CSDN和《程序员》杂志编辑与社区共同打造，涵盖大数据及Hadoop领域，萃取最精华Hadoop与大数据技术内容，每周四发送。

	CSDN 移动客户端		CSDN官方微信

查看Hadoop与大数据周刊往期回顾，更多精彩内容尽在Hadoop个性阅读。欢迎向您的朋友推荐订阅本邮列表。
如果不想再收到该邮件，可以取消订阅