`
cloudtech
  • 浏览: 4618843 次
  • 性别: Icon_minigender_1
  • 来自: 武汉
文章分类
社区版块
存档分类
最新评论

深入搜索引擎——海量信息的压缩、索引和查询

 
阅读更多

深入搜索引擎——海量信息的压缩、索引和查询

本文节选自《深入搜索引擎——海量信息的压缩、索引和查询 》一书 序言

译者序
1998年从美国斯坦福大学产生了一段传奇的财富神话,这就是今天市值约千亿美元的Google。众所周知,Google 正是由Lawrence Page在斯坦福大学发起的研究项目转变而来的。正是由于斯坦福大学对全球信息检索的杰出贡献,译者从事相关研究的时候也曾阅读了大量出自斯坦福大学的课件、论文和推荐教材。
在这些资源 中,《Managing gigabytes》,简记做“MG”,是其中一本极其重要的书籍。在译者集中学习信息检索的2005年,这本书是斯坦福大学信息检索和挖掘课程 的首选教材之一,和MIR 一起成为全球主要大学信息检索的主要教材。
MG深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。本书理论性较强,公式众多,很多数据的给出并没有做具体的解释,此外还包括一些文化背景差异带来的理解障碍。但是作者和译者联手为大家奉献了412个注解,协助大家更好地理解本书。
和MIR不同的是,MG更加具有实践性,这得益于3位作者精心编写的MG检索引擎,该检索引擎被实践证明具有很强的易用性和伸缩性,附录B介绍的新西兰电子图书馆就使用了MG代码作为其内核。MG源代码可以在原著的官网上找到。本书绝大部分算法和思想都在代码中被完整体现,是不可多得的学习和实践材料。
本书主要面向信息检索专业方向的研究生、从事搜索引擎相关工作和其他对搜索技术感兴趣的人们,除了从书中获取严谨的理论知识以外,还可在MG源代码上展开实际的研究。无论从哪一点来看,本书都是非常好的研究起点。
本书作者Ian H.Witten,Alistair Moffat和Timothy C.Bell均是信息检索领域赫赫有名的专家,特别是Timothy C.Bell教授在本书的翻译过程中给予了巨大的帮助,同时译者也为原著的勘误做出了贡献 。
最后要特别感谢包括原著3位作者在内的信息检索专家们无私地分享了他们的技术成果,并且感谢博文视点出版社大力引进,编辑孙学瑛女士及方方面面工作人员给予的帮助。由于译者能力有限,若有翻译不当之处,欢迎发送电子邮件至mgigabyte@gmail.com批评指正。
最后引用本书中的一段原话作为结尾:“在信息科学技术的历史上,从来没有像今天这样,创造如此大的价值的如此多的技术却掌握在如此少的人的手里。”希望能够和原著的作者一样做出自己一份微薄的贡献。


梁斌
2009年2月15日

更多精彩资源:
设计博客 http://www.cnblogs.com/designbook
博客园: http://www.cnblogs.com/broadview/
Web开发专栏 http://blog.csdn.net/broadviewwebdev
嵌入式 http://blog.mcuol.com/Broadview/index.htm
程序设计专栏http://blog.csdn.net/broadviewprograming
数据库专栏 http://blog.csdn.net/broadviewdatabase
Phpchina: http://www.phpchina.com/home/space.php
Cn-java: http://www.cn-java.com/www1/?564186/
Itpub: http://space.itpub.net/13164110/

分享到:
评论

相关推荐

Global site tag (gtag.js) - Google Analytics