拼音搜索在中文搜索环境中是经常使用的一种功能,用户只需要输入关键词的拼音全拼或者拼音首字母,搜索引擎就可以搜索出相关结果。在国内,中文输入法基本上都是基于汉语拼音的,这种在符合用户输入习惯的条件下缩短用户输入时间的功能是非常受欢迎的;
一、安装拼音搜索插件
下载对应版本的elasticsearch-analysis-pinyin插件;
https://github.com/medcl/elasticsearch-analysis-pinyin/releases/download/v7.9.2/elasticsearch-analysis-pinyin-7.9.2.zip
在elasticsearch安装目录下的的plugin目录新建analysis-pinyin目录,并解压下载的安装包;
重启elasticsearch,可以看到已经正常加载拼音插件
[2022-01-13T20:37:25,368][INFO ][o.e.p.PluginsService ] [mango] loaded plugin [analysis-pinyin]
二、使用拼音插件
试一下分词效果,可以看到除了每个词的全频,还有每个字的首字母缩写;
POST _analyze
{
"analyzer": "pinyin",
"text": "我爱你,中国"
}
{
"tokens" : [
{
"token" : "wo",
"start_offset" : 0,
"end_offset" : 0,
"type" : "word",
"position" : 0
},
{
"token" : "wanzg",
"start_offset" : 0,
"end_offset" : 0,
"type" : "word",
"position" : 0
},
{
"token