profile
Go with the flow

2222

"keyword_matching_init.py"위 코드를 통해서 배치 작업을 진행함 "data_path" 아래 위치한 파일 명을 읽어서 이를 바탕으로 배치 작업을 진행— batch 작업 중 오류가 발생할 경우 보통 data_path에 csv, xlsx 확장자가 아닌 파

2022년 4월 17일
·
0개의 댓글

test

테스트를 위한 환경 세팅은 아래와 같습니다.

2022년 4월 17일
·
0개의 댓글
post-thumbnail

Kafka란 무엇인가

카프카는 Publish-Subscribe 모델을 구현한 분산 메시징 시스템이다.데이터 파이프라인(Data Pipeline)을 구축할 때가장 많이 고려되는 시스템 중 하나가 '카프카(Kafka)' 일 것이다.LinkedIn에서 개발된 분산 메시징 시스템으로 2011년에

2022년 4월 17일
·
0개의 댓글

[Elasticsearch] 자주 사용하는 명령어

일반적인 상황에서는 empty list 반환pending 되어 있는 작업이 있는 경우 그 리스트 반환GC가 비정상적이거나 CPU가 높거나 검색이 밀리는 등 대부분의 문제의 원인을 유추할 수 있음\[Task Management API | Elasticsearch Refe

2022년 3월 21일
·
0개의 댓글

[Logstash] Elasticsearch 와 RDBMS 연동

Kibana - Stack Management - Logstash Pipelineshttps://s3-us-west-2.amazonaws.com/secure.notion-static.com/b598fa56-2d09-4b65-b08c-14b77f3921a0/Un

2022년 3월 21일
·
0개의 댓글

[Elasticsearch] Node Start and Stop

[Elasticsearch] Node Start and Stop Elasticsearch Node를 재시작 할 때 아래와 같은 방법으로 작업을 진행하여야 샤드들이 재배치 되지 않고 빠르게 재시작 할 수 있음 Shard Allocation Stop 노드를 중단했을

2022년 3월 21일
·
0개의 댓글