solr安装配置:
http://www.liqinglin0314.com/article/160
solr创建core:
http://www.liqinglin0314.com/article/179
我们发现用solr的默认分词器,可以分词英文,但是中文就分成了一个一个的字,这不是我们想要的结果,所以我们需要配置一个中文的分词器——ik分词器。
第一步:下载ik分词器https://files.cnblogs.com/files/ITDreamer/ikanalyzer-solr6.5.zip,并解压。
第二步:把两个jar包复制到apache-tomcat-9.0.26\webapps\solr\WEB-INF\lib下。
第三步:把剩下的三个文件复制到apache-tomcat-9.0.26\webapps\solr\WEB-INF\classes下,如果没有classes文件夹那就手动创建一个。
第四步:在solr-8.2.0\solrhome\allencore(我这里创建的叫allencore,这里写你自己创建的core名称)下的managed-schema(老版本叫schema.xml)。
<!-- ik分词器 --> <fieldType name="text_ik" class="solr.TextField"> <!-- 索引分词器 --> <analyzer type="index" isMaxWordLength="false" class="org.wltea.analyzer.lucene.IKAnalyzer"/> <!-- 查询分词器 --> <analyzer type="query" isMaxWordLength="true" class="org.wltea.analyzer.lucene.IKAnalyzer"/> </fieldType>
第五步:重启tomcat,测试一下,这里就可看到我们刚刚配置的ik中文分词器了。
把我们刚刚的hello world!你好世界!再复制进去试试。
中文分词正常使用~~