Whitespace Analyzer
每当遇到空白字符时,空格分析器都会将文本拆分为token。
示例
POST _analyze
{
"analyzer": "whitespace",
"text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone."
}
分词结果
[ The, 2, QUICK, Brown-Foxes, jumped, over, the, lazy, dog's, bone. ]
参数
whitespace analyzer
不接受任何参数
定义
Whitespace Analyzer
包括
- Tokenizer
- Whitespace Tokenizer
自定义空格分词器,通常通过添加自定义filter来增加结果处理。
PUT /whitespace_example
{
"settings": {
"analysis": {
"analyzer": {
"rebuilt_whitespace": {
"tokenizer": "whitespace",
"filter": [
## 添加你的filter
]
}
}
}
}
}