Hadoop权威指南(第3版)
华东师范大学数据科学与工程学院 译
出版时间:2014年10月
页数:678
“你终于有机会向大师学习Hadoop了——不仅是技术,还有常识和大实话。”
——Doug Cutting,Cloudera
准备好释放数据的强大潜能了吗?借助于这本《Hadoop权威指南》,你将学习如何使用Apache Hadoop构建和维护稳定性高、伸缩性强的分布式系统。本书是为程序员写的,可帮助他们分析任何大小的数据集。本书同时也是为管理员写的,帮助他们了解如何设置和运行Hadoop集群。
本书通过丰富的案例学习来解释Hadoop的幕后机理,阐述了Hadoop如何解决现实生活中的具体问题。第3版覆盖Hadoop的最新动态,包括MapReduce API、MapReduce 2及其灵活性更强的执行模型(YARN)。
本书主题:
· 使用Hadoop分布式文件系统(HDFS)存储大数据集
· 使用MapReduce运行分布式计算
· 使用Hadoop的数据和I/O构建块进行压缩、数据完整性、序列化(包括Avro)和持久化
· 探究MapReduce应用开发中常见的陷阱和高级特性
· 设计、构建和管理Hadoop专用集群或在云上运行Hadoop
· 使用Sqoop把数据从关系型数据库载入HDFS,
· 使用Pig查询语言执行大规模数据处理
· 使用Hive(Hadoop的数据仓库系统)来分析数据集
· 充分利用HBase(针对结构化数据和半结构化数据)以及充分利用Zookeeper构建分布式系统
书名:Hadoop权威指南(第3版)
译者:华东师范大学数据科学与工程学院 译
国内出版社:清华大学出版社
出版时间:2014年10月
页数:678
书号:978-7-302-37085-7
原版书书名:Hadoop: The Definitive Guide, third edition
原版书出版商:O'Reilly Media
Tom White
自从 2007 年 2 月以来,Tom White 一直担任 Apache Hadoop 项目负责人。他是 Apache 软件基金会的成员之一。他就职于 Cloudera,该公司提供 Hadoop 产品、服 务、支持和培训服务。在此之前,Tom 是一名独立的 Hadoop 顾问,曾帮助很多公 司搭建、使用和扩展 Hadoop 应用。他曾为 O’Reilly.com,Java.net 和 IBM 的 developerWorks 写过大量文章,并定期在行业大会上发表 Hadoop 主题演讲。Tom 拥有英国剑桥大学数学学士学位和利兹大学科学哲学硕士学位。现在,他和他的家 人居住在旧金山。