한글 형태소 kiwi 분석기를 사용하여 python으로 문장별로 elasticsearch 적재
from kiwipiepy import Kiwi
from PUT_func import put
def file_open(path):
with open(path, "r") as f:
text = f.read()
print(text)
kiwi = Kiwi()
str_list = kiwi.split_into_sents(text)
each_sentences(str_list)
def each_sentences(str_list):
for id_num in range(1, len(str_list)+1):
print(id_num)
data = {"text": str_list[id_num - 1].text}
print(data)
put(data, id_num)
# execute
file_open("input.txt")
from elasticsearch import Elasticsearch
def put(data, id_num):
es = Elasticsearch("http://192.168.101.218:9200")
index_name = 'test_index'
print(es.info())
es.index(index=index_name, id=id_num, body=data)
es.indices.refresh(index=index_name)
get /test_index/_search
원본
물가 상승으로 인해 생활비가 늘어나고 있습니다. 나만의 꿈을 이뤄내기 위해 노력하고 있습니다. '언젠가' 가까운 미래에 해외로 여행을 가보고 싶습니다. 우리나라의 전통음식을 맛보면서 문화를 느껴보세요.
예상 결과
{'text': '물가 상승으로 인해 생활비가 늘어나고 있습니다.'}
{'text': '나만의 꿈을 이뤄내기 위해 노력하고 있습니다.'}
{'text': ''언젠가' 가까운 미래에 해외로 여행을 가보고 싶습니다.'}
{'text': "우리나라의 전통음식을 맛보면서 문화를 느껴보세요."}
키위 모듈 사용시
{'text': '물가 상승으로 인해 생활비가 늘어나고 있습니다.'}
{'text': '나만의 꿈을 이뤄내기 위해 노력하고 있습니다. '언젠가''}
{'text': '가까운 미래에 해외로 여행을 가보고 싶습니다.'}
{'text': "우리나라의 전통음식을 맛보면서 문화를 느껴보세요."}
input에서 개행을 추가한 뒤 키위 모듈 사용시
물가 상승으로 인해 생활비가 늘어나고 있습니다. 나만의 꿈을 이뤄내기 위해 노력하고 있습니다.
'언젠가' 가까운 미래에 해외로 여행을 가보고 싶습니다. 우리나라의 전통음식을 맛보면서 문화를 느껴보세요.
{'text': '물가 상승으로 인해 생활비가 늘어나고 있습니다.'}
{'text': '나만의 꿈을 이뤄내기 위해 노력하고 있습니다.'}
{'text': ''언젠가''}
{'text': '가까운 미래에 해외로 여행을 가보고 싶습니다.'}
{'text': "우리나라의 전통음식을 맛보면서 문화를 느껴보세요."}
잘 봤습니다. 좋은 글 감사합니다.