LIKE '%fox%'로 전체 로우 탐색"The quick brown fox" → whitespace tokenizer → lowercase → stop → snowball 적용 → "quick", "brown", "fox"
_analyze와 Term 쿼리_analyze APIPOST /_analyze { "analyzer": "standard", "text": "Hello, HELLO, World!" }→ "hello", "world"
term 쿼리"term": { "username": "kimgn" }
PUT my_index3 { "settings": { "index": { "analysis": { "analyzer": { "my_custom_analyzer": { "type": "custom", "tokenizer": "whitespace", "filter": ["lowercase", "stop", "snowball"] } } } } } }
- 분석 결과 확인:
GET my_index3/_analyze { "analyzer": "my_custom_analyzer", "text": ["The quick brown fox jumps over the lazy dog"] }→ "quick", "brown", "fox", "jump", "over", "lazy", "dog"
_termvectors APIGET my_index3/_termvectors/1?fields=message
html_strip{ "tokenizer": "standard", "char_filter": ["html_strip"], "text": "<p>Hello <b>World</b></p>" }→ "hello", "world"
mapping"mappings": ["C++ => C_plus_plus"]→ "c_plus_plus"
pattern_replace"pattern": "(?<=\\p{Lower})(?=\\p{Upper})"→ "camelCaseWord" → "camel", "case", "word"
| 이름 | 기능 | 예시 |
|---|---|---|
standard | 문장 분석 | Quick, Fox, 123 |
letter | 문자 단위 | Quick, Fox |
whitespace | 공백 분리 | Quick-Fox, 123 |
uax_url_emailpattern"pattern": "[,|\\s]+"→ "apple, banana orange" → "apple", "banana", "orange"
path_hierarchy"/home/user/docs" → "/home", "/home/user", "/home/user/docs"
lowercase / uppercase"Fox" → "fox"
"fox" → "FOX"
stopsynonym"synonyms": ["usa, united states"]→ 동일하게 처리
ngram, edge_ngram, shingle"quick" → "q", "qu", "qui" 등
unique"fox", "fox" → "fox"
snowball"jumps", "jumped" → "jump"
nori"삼성전자의 주가가 상승했다" → "삼성전자", "주가", "상승"
