Talk is Cheap, Show me the Code! <<网站首页文章列表 搜索引擎入门——聊聊schema.xml配置 前言Lucene中一个很重要的概念就是文档(Document),它代表一条建立索引的独立且完整的数据。可以对标到我们关系数据库的一条记录。一个Document包含很多个域(Field),对标数据库的字段Column。Field的一些属性配置对标字段的属性。本身Lucene对Document的Field是开放式的,不同Field的Document可以索引到一起,有点类似于noSQL的概念,属于schema-free的。但是这种开放式结构会造成“开发一时爽,维护骂爹娘”的情况,所以Solr在封装Lucene的时候通过schema.xml文件来规范Document的Field定义。类似于MongoDB的一些ORM框架(Morephia、spring-data-mongo)做的事,其实就是定义一个标准、做个存根,方便排查。所以,schema.xml配置的内容就出来了:+ Field Type 定义:定义了字段类型,string、int、double、text等等,名字是自取的。+ Field 定义:字段,比如positionid、name、age等等。------ schema.xml的大致结构XML -- -- -- positionid keyword 从实际的配置文件也可以发现,schema中确实主要包含两个内容,types和fields。+ types:定义Field类型的元数据。+ fields:表示这个索引的每条 Java 搜索引擎 schema 分词器 2019-07-24 浏览(745) 阅读原文>> 1 栏目导航 关于我 不止技术 工程化应用(23) 技术学习/探索(32) 自娱自乐(2) 还有生活 随便写写(1) 娱乐/放松(1) 点击排行 SpringBoot2从零开始(二)——多数据源配置 搜索引擎进阶——IK扩展之动态加载与同义词 从零开发参数同步框架(二)—— 前期准备之工具类 Nginx的nginx.conf配置部分解释 springMVC中controller参数拦截问题处理 Maven项目一键打包、上传、重启服务器 微信小程序深入踩坑总结 微信小程序的搜索高亮、自定义导航条等踩坑记录 标签云 Java(19) 搜索引擎(13) Solr(7) 参数同步(6) SpringBoot(4) ES(3) ElasticSearch(3) JVM(3) Netty(3) Spring(3) mongoDB(3) 设计模式(3) Curator(2) Docker(2) Dubbo(2) 大家推荐 魔神重返战场!厄祭战争的巴巴托斯:第四形态 搜索引擎入门——Solr查询参数详解以及如何使用Java完成对接 来聊一聊这个被淘汰的图片验证码 搜索引擎入门——聊聊schema.xml配置 搜索引擎入门——启动第一个Solr应用 君子性非异也,善假于物也——功能强大的Postman 择其善而从之——我为什么开始学习ElasticSearch 实现一个关于队列的伪需求是一种怎样的体验