集体智慧编程
出版时间:2008年11月
“太棒了!对于初学这些算法的开发者而言,我想不出有比这本书更好的选择了,而对于像我这样学过AI的老朽而言,我也想不出还有什么更好的办法能够让自己重温这些知识的细节。”
——Dan Russell,资深技术经理,Google
“Toby的这本书非常成功地将机器学习算法这一复杂的议题拆分成了一个个既实用又易懂的例子,我们可以直接利用这些例子来分析当前网络上的社会化交互作用。假如我早两年读过这本书,就会省去许多宝贵的时间,也不至于走那么多的弯路了。”
——Tim Wolters,CTO,Collective Intellect
想了解蕴藏在搜索排名、商品推荐、社会化书签以及在线婚介应用背后的巨大威力吗?本书的内容引人入胜,它将会告诉我们如何构造Web 2.0应用,使其能够挖掘有大量用户参与的互联网应用所产生的海量数据。利用书中介绍的这些复杂算法,可以编写出智能程序、访问其他Web站点的数据集、从我们自己的应用程序中搜集用户数据,进而分析和理解这些数据。
本书将引领我们进入机器学习与计算统计的世界,并解释如何得出有关用户体验、市场营销、个人品味以及我们和他人每天搜集的用户行为方面的结论。书中对每一个算法都进行了详细的描述,并附以简洁的代码,这些代码可以直接用于我们的Web站点、博客、维基,或者其他特定的应用。
本书向读者介绍了:
* 令在线零售商向用户提供商品或媒体推荐的协作型过滤技术;
* 在一个大型数据集中检测相似项群组的聚类方法;
* 在针对某一问题的数以百万计的可能题解中进行搜索,并从中选出最优解的优化算法;
* 用于垃圾过滤技术的贝叶斯过滤器,如何根据单词类型及其他特征对文档进行分类;
* 用于对在线约会站点的用户进行配对的支持向量机;
* 用于问题求解的智能进化技术——随着玩游戏的次数逐渐增多,计算机玩家如何通过改进自身代码的方式来发展技能。
本书的每一章后都有练习,这些练习对算法进行了扩展,使其变得更加强大。让我们超越以数据库为后端的简单应用系统,挖掘互联网数据的价值,为我所用!
书名:集体智慧编程
出版时间:2008年11月
书号:978-7-121-07539-1
原版书出版商:O'Reilly Media
Toby Segaran
Toby Segaran是《Programming Collective Intelligence》的作者,生物技术软件公司Incellico的创始人。是Genstruct公司的软件开发主管,这家公司涉足计算生物领域,他本人的职责是设计算法,并利用数据挖掘技术来辅助了解药品机理。Toby Segaran还为其他几家公司和数个开源项目服务,帮助它们从收集到的数据当中分析并发掘价值。除此以外,Toby Segaran还建立了几个免费的网站应用,包括流行的tasktoy和Lazybase。他非常喜欢滑雪与品酒,其博客地址是blog.kiwitobes.com,现居于旧金山。
本书封面上的动物是王企鹅(Aptenodytes patagonicus)。尽管其命名与巴塔哥尼亚(Patagonia)地区有关,但是王企鹅却并非产于南美洲;它们在那里的最后一片栖息地早在19世纪就已经被海豹狩猎者给摧毁了。如今,这些企鹅分布在次南极群岛一带,如爱德华王子(Prince Edward)、克罗泽特(Crozet)、麦格理(Macquarie),以及福克兰群岛(Falkland Islands)等地。它们居住在海滨及靠近大海的地势平坦的冰川地区。王企鹅完全是一种群居性的鸟类;在它们的繁殖地,种群的数量多达1万,而且它们时常聚集在一起饲养幼鸟。
王企鹅站立时有76.2厘米(30英寸)高,体重达到13.6千克(30磅),它们是企鹅家族中体型最大的种群之一——仅次于其近邻帝企鹅。除了体型以外,王企鹅还有一个主要的识别特征,那就是位于其头部的鲜橙色斑点,这些斑点一直向下延伸到其胸部的银白色羽毛处。王企鹅身形圆滑,并且不像帝企鹅那样只会在陆地上跳跃,它们还可以奔跑。王企鹅很习惯于海洋生活,它们以鱼类和乌贼为食,并且可以向下潜到213.36米(700英尺)的深度,比其他大多数企鹅潜得还要深。由于雄性和雌性在体型和外观上都非常接近,因此人们一般根据它们的行为迹象(比如交配行为)对其加以区分的。
王企鹅并不筑巢;相反,它们会将唯一的一枚卵塞入肚皮下面,并放在两脚的蹼上。没有任何其他鸟类的繁殖周期会比王企鹅的还要长,这些企鹅每三年繁殖两次,并且每次只孵化一只幼鸟。王企鹅的幼鸟身型肥胖呈褐色,浑身毛茸茸的,以至于早期的探险者们以为这是与王企鹅完全不同的另一类企鹅,并将其称为“woolly penguins(意指毛茸茸的企鹅)”。王企鹅在全世界范围内的数量有200万对,它并不属于濒危物种,世界自然保护联盟已将其列入了无危物种。
本书封面的图片取自J.G. Wood的《Animate Creation》。