大数据猩球:海量数据处理实践指南
唐李洋 译
出版时间:2016年08月
页数:212
从超大规模的事件流中发现模式可能很困难,但是学习如何发现这些模式却不见得很难。这本实战指南告诉我们如何利用Apache Hadoop,使用简单、有趣、精致的工具,解决大规模数据处理中的模式发现以及很多其他问题。通过处理真实数据、解决现实问题,你将对大数据有一个实用的、可操作的认识。本书非常适合Hadoop新手,也很适合那些想要提升技能的有经验的实践家。其中,第一部分解释了Hadoop和MapReduce的工作原理,第二部分讲述了很多数据处理用到的分析模式。通过一些练习,你还将学会如何使用Apache Pig进行数据处理。
● 学习使用Hadoop的必要原理,包括数据和计算在集群中的移动行为
● 深入理解MapReduce机制,用Python创建你的第一个MapReduce作业
● 理解如何以Pig脚本的形式运行MapReduce作业链
● 全书使用真实数据集,即棒球统计数据集
● 提供分析模式的示例,并学习何时何地使用这些分析模式
书名:大数据猩球:海量数据处理实践指南
译者:唐李洋 译
国内出版社:电子工业出版社
出版时间:2016年08月
页数:212
书号:978-7-121-29418-1
原版书书名:Big Data for Chimps
原版书出版商:O'Reilly Media
Philip Kromer
Flip is the founder and CTO at Infochimps.com, a big data platform that makes acquiring, storing and analyzing massive data streams transformatively easier. He enjoys Bowling, Scrabble, working on old cars or new wood, and rooting for the Red Sox.
Russell Jurney
Russsel Jurney在美国和墨西哥的赌场开始他的数据分析生涯。他开发了一个Web应用来分析老虎机的性能。在经历了创业、交互式媒体和新闻业以后,他到了硅谷,在Ning和LinkedIn开始构建可扩展的数据分析应用。