标签:搜索引擎

深入搜索引擎-好书天下
计算机类

深入搜索引擎

《深入搜索引擎:海量信息的压缩、索引和查询》是斯坦福大学信息检索和挖掘课程的首选教材之一,并已成为全球主要大学信息检索的主要教材。《深入搜索引擎:海量信息的压缩、索引和查询》理论和实践并重,深入浅出地给出了海量信息数据处理的整套解决方案,包括压缩、索引和查询的方方面面。其最大的特色在于不仅仅满足信息检索理论学习的需要,更重要的是给出了实践中可能面对的各种问题及其解决方法。 《深入...

解密搜索引擎技术实战-好书天下
计算机类

解密搜索引擎技术实战

《解密搜索引擎技术实战-Lucene&Java精华版(附盘)》,本书主要包括总体介绍部分、爬虫部分、自然语言处理部分、全文检索部分以及相关案例分析。爬虫部分介绍了网页遍历方法和如何实现增量抓取,并介绍了从网页等各种格式的文档中提取主要内容的方法。自然语言处理部分从统计机器学习的原理出发,包括了中文分词与词性标注的理论与实现以及在搜索引擎中的实用等细节,同时对文档排重、文本分类、...

SIVA范式-好书天下
经济管理

SIVA范式

本书主要探讨搜索引擎的发展给营销方式带来的革命性改变,并提出了SIVA分析范式的新理论。基于搜索引擎的营销方式,可以理解为:消费者通过搜索引擎留下了庞大的有关偏好、需求、渴望信息的数据,企业通过这些数据,明确消费者的个性化特征,把每一个消费者视觉化,把握个体特殊的潜在消费需求通过提供知识(回答问题)和物品的方式,传递到有这些特殊需求的个人,创造企业的价值。这种营销方式,不仅仅是传统的“...

自己动手写网络爬虫-好书天下
计算机类

自己动手写网络爬虫

本书介绍了网络爬虫开发中的关键问题与Java实现。主要包括从互联网获取信息与提取信息和对Web信息挖掘等内容。本书在介绍基本原理的同时注重辅以具体代码实现来帮助读者加深理解,书中部分代码甚至可以直接使用。 本书适用于有Java程序设计基础的开发人员。同时也可以作为计算机相关专业本科生或研究生的参考教材。

自己动手写搜索引擎-好书天下
计算机类

自己动手写搜索引擎

《自己动手写搜索引擎》是猎兔企业搜索开发团队的软件产品研发和项目实践的经验汇总。《自己动手写搜索引擎》全方位展现出一个商用级别的Lucene搜索解决方案,主要包括爬虫、自然语言处理和搜索实现部分。爬虫部分介绍了网页遍历方法和从网页提取主要内容的方法。 自然语言处理部分包括了中文分词从理论到实现以及在搜索引擎中的实用等细节。 其他自然语言处理的经典问题与实现包括:文档排重、文...

添加微信公众号:“好书天下”获取书籍

添加微信公众号:“好书天下”获取书籍添加微信公众号:“好书天下”获取书籍