当前位置:首页 > 操作系统 >
《Solr权威指南(上卷)》电子书封面

Solr权威指南(上卷)

  • 发布时间:2020年06月08日 10:37:48
  • 作者:兰小伟
  • 大小:120 MB
  • 类别:Solr电子书
  • 格式:PDF
  • 版本:高清版
  • 评分:9.2

    Solr权威指南(上卷) PDF 高清版

      给大家带来的一篇关于Solr相关的电子书资源,介绍了关于Solr、Solr指南方面的内容,本书是由机械工业出版社出版,格式为PDF,资源大小120 MB,兰小伟编写,目前豆瓣、亚马逊、当当、京东等电子书综合评分为:9.2。

      内容介绍

      Solr权威指南(上卷) 以图文并茂的形式、通俗易懂的语言讲解了Solr使用中的各个知识点,能够帮助对Solr感兴趣的读者快速了解Solr。由于目前有关Solr相关技术的书籍全部都是英文版的,所以对于英文不太好而又极其需要快速学会使用Solr的读者来说,这是一个福音。下卷:主要针对中高端读者,重点介绍了关于Solr查询、SolrJ、SolrCloud、Solr性能优化等的相关知识。对于Solr查询,下卷主要针对的是高阶知识部分,包括使用游标实现高效的深度分页查询、实现对查询返回的查询结果集进行自定义排序、使用相关性权重来提高查询返回结果集的相关性、FunctionQuery的使用方法、FunctionQuery的自定义方法等;对于SolrJ、SolrCloud的介绍,则均是从基础概念开始,逐步深入到具体的使用和管理方法;对于Solr性能优化,则主要集中在注意事项、具体建议等实操部分的介绍。在全书后,还单独利用一章对之前没涉及的零散内容进行集中介绍,包括版本升级、自定义伪域、自定义Redis缓存、流式处理等内容。

      目录

      • 序言
      • 第1章 初识Solr 1
      • 1.1 Solr是什么 1
      • 1.2 Solr的历史 2
      • 1.3 为什么要选择Solr 2
      • 1.4 Solr功能预览 3
      • 1.5 Solr下载 3
      • 1.6 Solr学习资源 5
      • 1.7 Windows平台下部署Solr 7
      • 1.7.1 部署Solr至Jetty 7
      • 1.7.2 部署Solr至Tomcat 13
      • 1.8 Linux平台下部署Solr 16
      • 1.9 玩转post.jar 20
      • 1.10 在Eclipse中编译Solr源码 25
      • 1.11 本章总结 27
      • 第2章 Solr基础 28
      • 2.1 Solr Core 28
      • 2.1.1 Solr Core简介 28
      • 2.1.2 Core的基本管理 30
      • 2.1.3 Core Http接口 35
      • 2.1.4 添加索引至Core 36
      • 2.2 Solr DIH 38
      • 2.2.1 索引文件夹下的文本文件 38
      • 2.2.2 索引JSON/XML/CSV文件 42
      • 2.2.3 使用Tika索引Word/Excel/PDF 45
      • 2.2.4 索引网络上的远程文件 52
      • 2.2.5 索引XML文件 55
      • 2.2.6 从数据库中导入数据至Solr 57
      • 2.2.7 Solr DIH总结 62
      • 2.3 Solr Full Import全量导入 78
      • 2.4 Solr Delta-import增量导入 80
      • 2.5 Solr索引 85
      • 2.5.1 Lucene索引原理 85
      • 2.5.2 Lucene中常见术语详解 87
      • 2.5.3 创建Solr索引 98
      • 2.5.4 Solr Cell 99
      • 2.5.5 Solr索引去重检测 102
      • 2.5.6 Solr更新请求处理链 104
      • 2.5.7 Solr原子更新 105
      • 2.5.8 使用Luke查看索引 107
      • 2.6 本章总结 109
      • 第3章 Solr配置 110
      • 3.1 solr.xml配置详解 110
      • 3.2 solrconf?ig.xml配置详解 112
      • 3.3 schema.xml配置详解 139
      • 3.3.1 Solr Schema设计思想 139
      • 3.3.2 Solr眼里的世界 139
      • 3.3.3 域分词 140
      • 3.3.4 Solr的schema文件 140
      • 3.3.5 Solr的域类型 141
      • 3.3.6 Solr的域 153
      • 3.3.7 Schema API 157
      • 3.3.8 Schemaless Mode 165
      • 3.4 data-conf?ig.xml配置详解 167
      • 3.5 zoo.cfg配置详解 169
      • 3.6 本章总结 169
      • 第4章 Solr分词 170
      • 4.1 分词的基本概念 170
      • 4.1.1 理解Analyzer 170
      • 4.1.2 理解Tokenizer 171
      • 4.1.3 理解TokenFilter 172
      • 4.2 Solr分词器 172
      • 4.2.1 Analyzer 173
      • 4.2.2 Tokenizer 174
      • 4.2.3 TokenFilter 182
      • 4.2.4 CharFilter 202
      • 4.2.5 Solr自定义分词 206
      • 4.3 中文分词器 217
      • 4.3.1 IK分词器 217
      • 4.3.2 Ansj分词器 223
      • 4.3.3 MMSeg4J分词器 233
      • 4.3.4 Paoding分词器 240
      • 4.3.5 Jcseg分词器 245
      • 4.3.6 Ictclas分词器 258
      • 4.3.7 FudanNLP 259
      • 4.3.8 HanLP 262
      • 4.3.9 Jieba分词器 266
      • 4.3.10 分词器使用建议 268
      • 4.4 本章总结 270
      • 第5章 Solr查询 271
      • 5.1 Solr查询概述 271
      • 5.2 Solr查询相关度简述 273
      • 5.3 Solr的查询语法解析器 275
      • 5.4 Lucene的基本查询语法 283
      • 5.5 Solr的标准查询语法解析器 287
      • 5.6 Solr DisMax 288
      • 5.7 Solr eDisMax 291
      • 5.8 Solr的其他查询语法解析器 298
      • 5.9 Query VS Filter Query 305
      • 5.9.1 fq VS q 306
      • 5.9.2 Filter Query缓存 307
      • 5.9.3 Filter Query执行顺序 308
      • 5.9.4 Post Filter 308
      • 5.10 Solr返回结果 309
      • 5.10.1 设置响应输出格式 309
      • 5.10.2 选择返回域 310
      • 5.10.3 分页查询 312
      • 5.11 Solr排序 313
      • 5.11.1 根据域进行排序 313
      • 5.11.2 缺失值处理 314
      • 5.11.3 排序的内存占用 315
      • 5.12 调试查询结果 315
      • 5.12.1 返回调试信息 315
      • 5.12.2 开启调试模式 316
      • 5.13 本章总结 316
      • 第6章 Solr Facet 317
      • 6.1 理解Facet 317
      • 6.2 Facet简单示例 319
      • 6.3 Query Facet 326
      • 6.4 Range Facet 328
      • 6.5 FacetFilter 330
      • 6.6 Multiselect Faceting 335
      • 6.6.1 key 335
      • 6.6.2 tag 336
      • 6.7 本章总结 339
      • 第7章 Solr高亮 340
      • 7.1 什么是Solr高亮 340
      • 7.2 Solr高亮的工作原理 342
      • 7.2.1 Fragmenter 348
      • 7.2.2 Scorer 349
      • 7.2.3 Encoder & Formatter 349
      • 7.3 Facet & Highlighting 350
      • 7.4 高亮多值域 351
      • 7.5 高亮参数 352
      • 7.6 FastVectorHighlighter 355
      • 7.7 PostingsHighlighter 356
      • 7.8 本章总结 358
      • 第8章 Solr Query Suggestion查询建议 360
      • 8.1 Spell-Check 361
      • 8.1.1 Spell-Check简单示例 361
      • 8.1.2 Spell-Check查询组件 362
      • 8.2 Autosuggest 366
      • 8.3 基于N-Gram实现Autosuggest 369
      • 8.4 基于用户行为实现Autosuggest 371
      • 8.5 本章总结 375
      • 第9章 Solr Group分组 376
      • 9.1 Result grouping VS Field collapsing 377
      • 9.2 按照指定域分组 377
      • 9.3 每个分组返回多个文档 381
      • 9.4 按照Function动态计算值分组 382
      • 9.5 按照任意Query分组 383
      • 9.6 Group的分页与排序 383
      • 9.7 Group& Facet 384
      • 9.8 Group分布式查询 387
      • 9.9 Group缓存 388
      • 9.10 使用Collapsing Query Parser实现高效的Field Collapsing 388
      • 9.11 Solr Group VS SQL Group by 389
      • 9.12 本章总结 390
      • 第10章 Solr企业级应用 391
      • 10.1 Solr源码编译与补丁应用 391
      • 10.2 部署Solr 396
      • 10.2.1 构建你自己的Solr发布版本 397
      • 10.2.2 Embedded Solr 397
      • 10.3 Solr硬件要求与系统配置 397
      • 10.3.1 内存和SSD 397
      • 10.3.2 JVM配置 398
      • 10.3.3 思考Solr索引与查询性能 401
      • 10.4 Solr数据批量导入 405
      • 10.5 Solr Shard与Replication 406
      • 10.5.1 Shard 406
      • 10.5.2 Replicate 408
      • 10.6 Core管理 410
      • 10.7 Solr集群管理 412
      • 10.7.1 Solr Ping健康检测 412
      • 10.7.2 Solr配置文件管理 413
      • 10.8 如何与Solr交互 414
      • 10.8.1 使用REST API与Solr交互 415
      • 10.8.2 使用SolrJ与Solr进行交互 415
      • 10.9 监控你的Solr 418
      • 10.9.1 Solr的性能统计 418
      • 10.9.2 Solr的缓存性能 419
      • 10.9.3 Solr JMX 419
      • 10.9.4 Solr日志 424
      • 10.9.5 Solr负载测试 424
      • 10.10 Solr版本升级 428
      • 10.11 本章总结 428

      学习笔记

      对python 操作solr索引数据的实例详解

      测试代码1: def test(self): data = {"add": {"doc": {"id": "100001", "*字段名*": u"我是一个大好人"}}} params = {"boost": 1.0, "overwrite": "true", "commitWithin": 1000} url = 'http://127.0.0.1:8983/solr/mycore/update?wt=json' headers = {"Content-Type": "application/json"} r = requests.post(url, json=data, params=params, headers=headers) print r.text def Index_data(self): solr = pysolr.Solr('http://127.0.0.1:8983/solr/mycore/', timeout=10) # How you'd index data. result = solr.add([ { "id": "doc_1", "title": "A test document", }, { "id": "doc_2", "title": "The Banana: Tasty or Dangerous?", }, ]) print result 测试代码2: 实际数据: def Index_Data_FromCSV(self, csvfile): ''' 从CSV文件中读取数据,并索引到solr中 :param csvfile: csv文件,包括完整路径……

      Ubuntu16.04安装部署solr7的图文详细教程

      本文为大家分享了Ubuntu16.04安装部署solr7的具体方法,供大家参考,具体内容如下 VMware12.0+Ubuntu16.04+jdk1.8.0_171+Tomcat8.0.53+solr7.4.0 首先看看安装成功的界面,纪念一下,哈哈哈…… 在安装部署solr之前,先安装好jdk1.8和Tomcat8.0的环境,然后对下载好的solr进行解压: 解压后的文件夹有以下内容: 然后我们进入到/server/solr-webapp目录,里面有一个webapp,将这个webapp复制到/usr/local/solr/tomcat/apache-tomcat-8.0.53/webapps下并从命名为solr(名字随便起),这里命名为solr。 将~/Downloads/solr-7.4.0/server/lib/ext下的所有jar都复制到/usr/local/solr/tomcat/apache-tomcat-8.0.53/webapps/solr/WEB-INF/lib下面。(这个solr就是上面一步的solr) 将~/Downloads/so……

      详解java整合solr5.0之solrj的使用

      1、首先导入solrj需要的的架包 2、需要注意的是低版本是solr是使用SolrServer进行URL实例的,5.0之后已经使用SolrClient替代这个类了,在添加之后首先我们需要根据schema.xml配置一下我们的分词器 这里的msg_all还需要在schema.xml中配置 它的主要作用是将msg_title,msg_content两个域的值拷贝到msg_all域中,我们在搜索的时候可以只搜索这个msg_all域就可以了, solr默认搜索需要带上域,比如 solr更改默认搜索域的地方也在schema.xml,它默认是搜索text域的,但是5.0之后不在这里配置默认搜索域了,它的文档也告诉我们,在solrconfig.xml中配置 在solrconfig.xml中配置默认搜素域,这样我们就可以按照我们自己的域进行搜索了 配置好……

      Solr通过特殊字符分词实现自定义分词器详解

      前言 我们在对英文句子分词的时候,一般采用采用的分词器是WhiteSpaceTokenizerFactory,有一次因业务要求,需要根据某一个特殊字符(以逗号分词,以竖线分词)分词。感觉这种需求可能与WhiteSpaceTokenizerFactory相像,于是自己根据Solr源码自定义了分词策略。 业务场景 有一次,我拿到的数据都是以竖线“|”分隔,分词的时候,需要以竖线为分词单元。比如下面的这一堆数据: 有可能你拿到的是这样的数据,典型的例子就是来自csv文件的数据,格式和下面这种类似: 分词思路 在Solr的schema.xml文件中,有这样的配置 fieldType name="text_ws" class="solr.TextField" positionIncrementGap="100" analyzer tokenizer class="solr.WhitespaceTok……

      python 动态迁移solr数据过程解析

      前言 上项目的时候,遇见一次需求,需要把在线的 其中一个 collection 里面的数据迁移到另外一个collection下,于是就百度了看到好多文章,其中大部分都是使用导入的方法,没有找到在线数据的迁移方法。于是写了python脚本,分享出来。 思路: collection数据量比较大,所以一次性操作所有数据太大,于是分段执行操作。 先分段 按1000条数据量进行查询,处理成json数据 把处理后的json数据 发送到目的collection上即可 实现: 一、使用http的接口先进行查询 使用如下格式查询: 其中:collection_name 是你查询的collection的名称 rows 是需要查询多少行,这里设置为1000 start 从多少行开始进行查询,待会儿脚本里面就是……

      以上就是本次介绍的Solr电子书的全部相关内容,希望我们整理的资源能够帮助到大家,感谢大家对码农之家的支持。

      上一篇:Solr权威指南(下卷)

      下一篇:互联网企业安全高级指南

      展开 +

      收起 -

      • 《Solr权威指南(上卷)》PDF下载

      下载地址:百度网盘下载
      Solr相关电子书
      Processing语言权威指南
      Processing语言权威指南 超清扫描版 立即下载
      Hadoop大数据实战权威指南
      Hadoop大数据实战权威指南 高质量版

      大数据贵在落实! 本书是一本讲解大数据实战的图书,按照深入分析组件原理、充分展示搭建过程、详细指导应用开发编写。全书分为三篇,第一篇为大数据的基本概念和技术,主要介绍大数

      立即下载
      Flex 4权威指南
      Flex 4权威指南

      本书是Adobe公司的官方教程,以课程的形式逐步讲解了如何用Flex4开发一个完整的网上杂货商店应用程序,这个杂货商店能够动态显示数据和图像,并帮助用户完成结账流程,到数据提交至服务器为止。书中详细介绍了Flex4的相关知识点,具体包括构建、部署和调试RIA,使用功能强大的MXML语言编写了应用程序,使用MXML和ActionScript快速构建自定义用户界面,以及通过样式和皮肤自定义应用程序的外观等。

      立即下载
      JRockit权威指南:深入理解JVM
      JRockit权威指南:深入理解JVM 原书影印版

      深入JVM内部 剖析Java虚拟机原理 阐明Java性能提升关键 莫枢(RednaxelaFx) 阿里中间件团队推荐JVM参考书

      立即下载
      Arduino机器人权威指南
      Arduino机器人权威指南 高质量影印版

      John-David Warren、Josh Adams和Harald Molle会带你走进机器人的世界,教会你如何寻找配件、怎样制作机器人、怎样进行编程,甚至告诉你如何对机器人进行安全测试

      立即下载
      Android Gradle权威指南
      Android Gradle权威指南 完整高清版 立即下载
      HTML5权威指南
      HTML5权威指南 超清版

      做为下代Web规范,HTML5着眼于为互联网技术开发人员构建更为方便快捷、对外开放的沟通交流服务平台。业内广泛认为,在将来两年内,HTML5毫无疑问将变成移动互联行业的主宰者。 《 HTML5权威

      立即下载
      Android编程权威指南
      Android编程权威指南 高清第3版

      Android编程权威指南(第3版)主要以其Android训练营教学课程为基础,融合了几位作者多年的心得体会,是一本完全面向实战的Android编程权威指南。全书共36章,详细介绍了8个Android应用的开发过程

      立即下载
      读者留言
      郑正豪

      郑正豪 提供上传

      资源
      48
      粉丝
      40
      喜欢
      187
      评论
      10

      Copyright 2018-2020 www.xz577.com 码农之家

      投诉 / 推广 / 赞助:QQ:520161757