敏捷数据科学:用Hadoop创建数据分析应用
冯文中, 朱洪波 译
出版时间:2014年06月
页数:165
“在目前“数据科学”被大肆宣传的环境下,读到一本构建数据产品的实践指南让我耳目一新。Russell向我们逐步介绍了他利用数据来解决问题的敏捷哲学。”
——Mat Kelcey,matpalm.com 博主
对大数据的挖掘需要投入大量的人力和时间。怎么才能确保构建的是一个正确的模型?通过这本实践指南,你可以学到一套灵活的工具和方法论,在Hadoop上构建数据分析应用。
使用诸如Python、Apache Pig和D3.js等轻量级工具,你的团队能够创建一个敏捷环境来探索数据。我们会开发一个样例应用程序,挖掘你自己的电子邮箱数据。你也会学习到一种迭代式的开发方法,使得你能根据数据中的信息快速切换,进行不同类型的数据分析。书中所有的代码样例都可以在Heroku中以App形式运行。
· 用敏捷式大数据开发方法论创建分析应用
· 用数据-价值栈,在一系列敏捷周期中创建价值
· 用多种数据结构从单个数据集中提取特征,获取洞察
· 用图表可视化数据,通过交互性报表从不同角度展示数据
· 用历史数据进行预测,将预测转化为行动
· 在每个迭代周期过后获取用户反馈,确保项目方向正确
Russsel Jurney在美国和墨西哥的赌场开始他的数据分析生涯。他开发了一个Web应用来分析老虎机的性能。在经历了创业、交互式媒体和新闻业以后,他到了硅谷,在Ning和LinkedIn开始构建可扩展的数据分析应用。
书名:敏捷数据科学:用Hadoop创建数据分析应用
译者:冯文中, 朱洪波 译
国内出版社:电子工业出版社
出版时间:2014年06月
页数:165
书号:978-7-121-23619-8
原版书书名:Agile Data Science: Building Data Analytics Applications wit
原版书出版商:O'Reilly Media
Russell Jurney
Russsel Jurney在美国和墨西哥的赌场开始他的数据分析生涯。他开发了一个Web应用来分析老虎机的性能。在经历了创业、交互式媒体和新闻业以后,他到了硅谷,在Ning和LinkedIn开始构建可扩展的数据分析应用。