[TIL] 220916

Ariul·2022년 9월 15일
0

Today I Learned 🌳

목록 보기
12/13
post-thumbnail

FACT

  • [도서] '엘라스틱스택 개발부터 운영까지' 읽기
  • 엘라스틱서치 분석기, 토크나이저, 토큰 필터 정리
  • 프로그래머스 2문제 풀기

FEELING

  • 세상에........ 오늘 코테 스터디를 하면서 진짜 갈 길이 멀구나💭 라는 생각이 들었다.
    힘이 쭉 빠졌던 포인트는,

    1. 프로그래머스 레벨 1 문제 푸는 데도 그렇게 시간이 오래 걸리는데, 다른 분들은 높은 레벨의 문제들도 후딱후딱 잘 푸신다.
    2. 이 스터디의 목적은 문제 풀이 방식을 공유하는 게 아니라, 잘 모르는데 그냥 쓰는 것들을 깊게 파보면서 공부하는 것. 근데 저는 잘 모르는 정도가 아니라 그냥 모르겠는데요..? 오늘 처음 보는 게 왜 이리 많은지... 다른 분들이 해주시는 설명이 귀에 안 박히고 후루룩~ 후루룩~ 날아간다😹
  • 물론 다른 분들은 개발 공부를 오래 하셨다는 것을 알지만,
    그래서 실력 비교가 무의미한 행동인 걸 알지만,
    스터디를 하는 2시간 동안 홀로 뒤떨어진 기분을 온전히 느끼고 있으니.. 마인드 컨트롤이 매우 쉽지 않ㅇr....(엉엉)

  • 프로젝트 할 때는 와악 엘라스틱 겁나 방대하네!! 진짜 하드하게 파야겠다...
    운영 쪽으로 고민할 때는 와 모르는 거 진짜 많다 CS 공부 시급하다...
    코테 스터디할 때는 하 나 지금 자바 기본서부터 다시 봐야 할 것 같은데...
    ㅎ ㅏ ㅎ ㅏ 세상에 마상에
    지금 여기서 잠을 어떻게 더 쪼개야 하는지🤔❔ 오엠지 오엠지


FINDING

상황) 로그 스태시로 ES에 데이터 넣는데, 데이터 수가 뻥튀기(?)되는 문제

start_position => "beginning"
sincedb_path => "/dev/null"

이 설정으로 처음엔 2만 개, 그다음엔 1만 개의 데이터를 ES에 넣었다. 그럼 총 3만 개의 데이터가 들어가 있어야 하는데, 키바나로 확인해 보니 5만 개가 들어가 있었다!

오잉!?

start_position 문제인가 싶어서 beginning을 end로 바꿔봤는데도 문제 해결이 안 됐다.
혹시 sincedb_path 때문인가!? 해서 주석 처리를 했더니..!
원하는 대로 데이터가 잘 들어갔다!

이 문제 해결한다고 구글링하면서 알게 된 사실💡

  1. 파일 offset이 저장된 다음에 로그스태시를 재시작하면 beginning이나 end에 상관없이 해당 offset에서 재시작된다.
  2. /dev/null은 항상 비어있는 폴더고, 여기로 전송하면 데이터는 버려진다.

그니까 로그 스태시 입장에서 보면, 데이터가 이미 버려져서 어떤 데이터가 어디까지 올라갔는지 모르는데, 그것도 모르고 다시 실행하니까 처음에 넣었던 2만 건을 다 포함해서 다시 넣은 것!!!!!! 그래서 5만 = 2만 + (2만 + 1만)

후우 진짜 진짜 방대하다
그래도 내일부터는 데이터 차곡차곡 올릴 수 있어~ 좋아좋아~~😄✨


FUTURE ACTION

  • [도서] '엘라스틱스택 운영부터 개발까지' 정리하기
  • 분석기 설계하기
profile
정성과 진심을 담아 흔적을 기록하자💡

0개의 댓글