当前位置:首页 > 其它 >
《自制搜索引擎》电子书封面

自制搜索引擎

  • 发布时间:2020年05月21日 10:04:04
  • 作者:山田浩之
  • 大小:2.6 MB
  • 类别:搜索引擎电子书
  • 格式:PDF
  • 版本:高清版
  • 评分:8.9

    自制搜索引擎 PDF 高清版

      给大家带来的一篇关于搜索引擎相关的电子书资源,介绍了关于搜索引擎方面的内容,本书是由人民邮电出版社出版,格式为PDF,资源大小2.6 MB,山田浩之编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:7.5。

      内容介绍

      《自制搜索引擎》聚焦于Google和Yahoo!等Web搜索服务幕后的搜索引擎系统,首先讲解了搜索引擎的基础知识和原理,接着以现实中的开源搜索引擎Senna/Groonga为示例,使用该引擎的源代码引导读者亲自体验搜索引擎的开发过程。这部分讲解涉及了倒排索引的制作和压缩、检索的处理流程以及搜索引擎的优化等内容。又简单介绍了一些更加专业的搜索引擎的知识和要点,为读者今后进一步学习打下了基础。

      本书适合所有对搜索引擎感兴趣的技术人员阅读。

      目录

      • 第1章 搜索引擎是如何工作的  1
      • 第2章 准备全文搜索引擎的检索样本  37
      • 第3章 构建倒排索引  49
      • 第4章 开始检索吧  71
      • 第5章 压缩倒排索引  89
      • 第6章 挑战wiser的优化及参数的调整  113
      • 第7章 为今后更加深入的学习做准备  141

      学习笔记

      PHP自定义函数获取搜索引擎来源关键字的方法

      本文实例讲述了PHP自定义函数获取搜索引擎来源关键字的方法。分享给大家供大家参考,具体如下: 获取搜索引擎来源关键字的函数: function getKeywords() { // 搜索引擎关键字映射 static $host_keyword_map = array( 'www.baidu.com' = 'wd', 'v.baidu.com' = 'word', 'image.baidu.com' = 'word', 'news.baidu.com' = 'word', 'www.so.com' = 'q', 'video.so.com' = 'q', 'image.so.com' = 'q', 'news.so.com' = 'q', 'www.sogou.com' = 'query', 'pic.sogou.com' = 'query', 'v.sogou.com' = 'query', ); // 检查来源是否搜索引擎 if (!isset($_SERVER['HTTP_REFERER'])) { return ''; } $urls = parse_url($_SERVER['HTTP_REFERER']); if (!array_key_exists($urls['host'], $host_keyword_map)) { return ''; } $key = $host_keyword_map[$urls['host']]; // 检查关键字……

      Spring Boot与Kotlin 整合全文搜索引擎Elasticsearch的示例代码

      Elasticsearch 在全文搜索里面基本是无敌的,在大数据里面也很有建树,完全可以当nosql(本来也是nosql)使用。 这篇文章简单介绍Spring Boot使用Kotlin语言连接操作 Elasticsearch。但是不会做很详细的介绍,如果要深入了解Elasticsearch在Java/kotlin中的使用,请参考我之前编写的《Elasticsearch Java API 手册》 https://gitee.com/quanke/elasticsearch-java/ 里面包含使用实例,包含我们使用踩过的坑。 如果完全不了解Elasticsearch请先了解,安装好Elasticsearch服务 有多种方式连接Elasticsearch Spring Data Elasticsearch elasticsearch Java client 其他第三方库 需要注意的是,如果使用Spring Data Elasticsearch,spring boot 1.5++版本的不支持最新版本的elasticsea……

      ThinkPHP设置禁止百度等搜索引擎转码(简单实用)

      网站在移动端的阅读不可避免的会遇到转码问题,作为国内搜索引擎老大百度,自然要做技术的领头人了,做了百度转码,有些网站经过转码之后达到了想要的结果,但是有些网站经过百度加工后就是不忍直视,很多内容出现了错乱,Joe的网站也出现了一些错位,于是Joe用了Wordpress插件MobilePress,经过一些汉化修改,感觉比百度的转码更适合自己。 方法1、HTTP Response中显式声明,Cache-control:no-transform. 在config.php 文件中加入 'HTTP_CACHE_CONTROL' = 'private,no-transform', // 网页缓存控制 方法2、meta标签中显式声明Cache-control为no-tranform,格式为: headmeta http-equiv="Cache-Control" content="no-transform"//head 以上所述是小编给大家介……

      Django集成搜索引擎Elasticserach的方法示例

      1.背景 当用户在搜索框输入关键字后,我们要为用户提供相关的搜索结果。可以选择使用模糊查询 like 关键字实现,但是 like 关键字的效率极低。查询需要在多个字段中进行,使用 like 关键字也不方便,另外分词的效果也不理想。 全文检索方案 全文检索即在指定的任意字段中进行检索查询。 全文检索方案需要配合搜索引擎来实现。 搜索引擎原理 搜索引擎 进行全文检索时,会对数据库中的数据进行一遍预处理,单独建立起一份 索引结构数据 。 索引结构数据 类似字典的索引检索页 ,里面包含了关键词与词条的对应关系,并记录词条的位置。 搜索引擎进行全文检索时,将 关键字在索引数据中进行快速……

      以上就是本次介绍的搜索引擎电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:树莓派开始,玩转Linux

      下一篇:快速傅里叶变换:算法与应用

      展开 +

      收起 -

      下载地址:百度网盘下载
      搜索引擎相关电子书
      读者留言
      袁峻熙

      袁峻熙 提供上传

      资源
      35
      粉丝
      39
      喜欢
      159
      评论
      1

      Copyright 2018-2020 www.xz577.com 码农之家

      版权投诉 / 书籍推广 / 赞助:520161757@qq.com