当前位置:网站首页>自定义一个下划线分词器
自定义一个下划线分词器
2022-08-02 03:38:00 【绅士jiejie】
参考代码:
PUT /index
{
"settings": {
"analysis": {
"char_filter": {
"_to_space": {
"type": "mapping",
"mappings": [
"_ =>\\u0020"
]
}
},
"analyzer": {
"my_analyzer": {
"type": "custom",
"char_filter": [
"_to_space"
],
"tokenizer": "whitespace",
"filter": [
"lowercase"
]
}
}
}
}
}
以上思路简单描述下,其实底层还是使用的空格分词器,只是添加了一个过滤器,把下划线_换成了空格\u0020,扩展下,这里自然也可以把其他符号转成空格,再交给空格分词器做处理。
边栏推荐
猜你喜欢
随机推荐
字典基本操作方法
Transfer of UKlog.dat and QQ, WeChat files
多主复制的适用场景(1)-多IDC
多主复制的适用场景(2)-需离线操作的客户端和协作编辑
Location、navigator和History对象
offset、client 和 scroll
多主复制下处理写冲突(1)-同步与异步冲突检测及避免冲突
复制延迟案例(4)-一致前缀读
树莓派上FFMPEG/VLC播放海康网络摄像仪视频
BOM学习
ansible的安装与部署
拦截器Sercurity权限管理和加密方式的登录认证使用
其他语法和模块的导出导入
科研笔记(六) 基于环境感知的室内路径规划方法
Pycharm platform import scikit-learn
SCI期刊最权威的信息查询步骤!
复制延迟案例(3)-单调读
侦听器watch及其和计算属性、methods方法的总结
this指向问题
树莓派上QT连接海康相机









