书名:自己动手写搜索引擎
作者:罗刚
译者:
ISBN:9787121096402
出版社:
出版时间:2009-11
格式:epub/mobi/azw3/pdf
页数:353
豆瓣评分: 6.8
书籍简介:
《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。 自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。 其他自然语言处理的经典问题与实现包括:文档排重、文本分类、自动聚类、语法解析树、拼写检查、拼音转换等理论与实现方法。 在实现搜索方面,《自己动手写搜索引擎》用简单的例子介绍了完整的搜索实现过程,覆盖了从索引库的设计和索引库与数据库的同步到搜索用户界面设计与实现。搜索用户界面包括实现布尔逻辑查询、按区间范围查询、搜索结果按日期排序等。《自己动手写搜索引擎》还进一步介绍了搜索排序的优化方法。 最后以基于Lucene的搜索服务器Solr为例,展示了Lucene的最新应用方法。
作者简介:
书友短评:
@ 北在南方 很多代码有拼凑字数的嫌疑,也是一本how to 读物 。 @ wltan 代码贴太多了。 @ 致捷 都没有布拉布拉,直接上代码, 多快好省, 国内程序设计书籍的通病。 @ paan 垃圾 @ wauwa在整理 跟其他几本比较起来比较凌乱 @ paan 垃圾 @ 小小鱼小怪兽 最基本的抓取网页代码例子都跑步起来的,,,,还写毛线爬虫啊 @ Goal 代码太多了。 @ 北在南方 很多代码有拼凑字数的嫌疑,也是一本how to 读物 。 @ shenhua 初学者不适用,没有条理
添加微信公众号:好书天下获取
评论前必须登录!
注册