博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Solr系列二:Solr与mmseg4j的整合
阅读量:5825 次
发布时间:2019-06-18

本文共 864 字,大约阅读时间需要 2 分钟。

mmseg4j是一个很好的中文分词器,solr与mmseg4j的整合也非常简单。如下:

第一步:下载mmseg4j的jar包,网上搜索一下有很多下载地址,如下是csdn上的一个连接:http://download.csdn.net/detail/nrs12345/6986585

第二步:将下载的mmseg4j-analysis-1.9.1.jar、mmseg4j-core-1.9.1.jar、mmseg4j-solr-2.2.0.jar这三个jar包复制到tomcat下的webapps/solr/WEB-INF/lib目录下。

第三步:修改配置文件,打开solr home目录中的某一个core的目录,例如core0:然后打开core0/conf下的schema.xml文件。

第四步:在filedtype域插入如下代码:

4. 将mmseg4j-all-1.8.4-with-dic.war解压在一个临时文件夹中,然后将data文件夹内的chars.dic、units.dic、words.dic三个字典文件复制到TOMCAT_HOME/solr_home/core0/dic目录中;

5. 启动tomcat,访问http://localhost:8080/solr/admin/analysis.jsp,选择Field下拉选项中的type,后面输入textComplex,然后在Field value中随便复制一段中文文字,点击Analyz,就可以看到mmseg4j的分词结果了。

转载地址:http://uysdx.baihongyu.com/

你可能感兴趣的文章
sqlite简单实例
查看>>
我的友情链接
查看>>
Ubuntu切换用户
查看>>
xshell配色方案
查看>>
重设还原模式管理员密码
查看>>
VMware Workstation 8.0.4 添加共享磁盘
查看>>
Scenario 1 – HP C7000 Virtual Connect FlexFabric以太网网络设计Active/Standby Uplinks
查看>>
laravel 控制器调用命令
查看>>
Apache与Tomcat的区别
查看>>
switch ===
查看>>
python类中为什么要self?
查看>>
两个有序数组中的数据,合并到新的有序数组
查看>>
我的友情链接
查看>>
java web中调用JavaScript的几种方式
查看>>
工厂模式\单例模式\注册树模式
查看>>
WPF 和 WinForms Web 浏览器控件:CefSharp
查看>>
优化Hibernate所鼓励的7大措施
查看>>
访问 IIS 元数据库失败解决方法
查看>>
iOS系统中导航栏的转场解决方案与最佳实践
查看>>
Oauth2认证授权服务(django-oauth-toolkit)搭建及操作流程
查看>>