Skip to main content

Whitespace Analyzer

每当遇到空白字符时,空格分析器都会将文本拆分为token。

示例

POST _analyze
{
"analyzer": "whitespace",
"text": "The 2 QUICK Brown-Foxes jumped over the lazy dog's bone."
}

分词结果

[ The, 2, QUICK, Brown-Foxes, jumped, over, the, lazy, dog's, bone. ]

参数

whitespace analyzer 不接受任何参数

定义

Whitespace Analyzer 包括

  • Tokenizer
    • Whitespace Tokenizer

自定义空格分词器,通常通过添加自定义filter来增加结果处理。

PUT /whitespace_example
{
"settings": {
"analysis": {
"analyzer": {
"rebuilt_whitespace": {
"tokenizer": "whitespace",
"filter": [
## 添加你的filter
]
}
}
}
}
}