[Review] 데이터 분석가 2023 회고

윤진호·2023년 12월 31일
1

Review

목록 보기
17/17
post-thumbnail

2023년도 비루한 데이터 분석가의 회고록을 또 작성해본다. 늘 그랬듯 한 해가 지나갔고, 되짚어보면 이것저것 시도는 했는 데 과연 성장했을 지에 대해서는 의구심이 든다. 2022년도는 텍스트 외에 유통, 고객 데이터들과 SQL, Tableau 등을 익힐 수 있는 기회였고, 2023년도에는 분석 보고서 업무에서 벗어나 대규모 프로젝트를 관리하고 소프트 스킬(사업 기획, 커뮤니케이션, 발표 능력 등)을 익힐 수 있었다.

한 거

서강대학교 정보통신대학원 데이터사이언스, 인공지능트랙 합격

데이터 분석가로서의 경력은 차근차근 쌓았지만 비전공자 출신이다보니 막히는 지점들이 분명히 있었고 대학원 진학을 결심했다. 상반기 성균관대 공과대학 데이터사이언스융합학과 1곳에 지원했지만 탈락했다. 그리고 교훈을 얻어 하반기에는 총 6군데를 지원했고, 최종 3곳에 합격했다. 국민대에도 지인들이 많이 있었는데, 서강대 지원하는 게 낫겠다고 생각이 들었다. 멘토링도 들었었는데, 실질적으로 학업계획서만 일부 수정하고 면접 준비나 컨택, 영어공부 등은 별도로 하지 않았다. 회사 선배가 3월 입학 전에 영어 원서를 읽고 준비하면 좋을 것이라 해서 읽어볼 계획이다. (서강대학교 교재가 영어라는 정보를 들었다.)

  • 서강대학교 정보통신대학원 데이터사이언스, 인공지능트랙(최종 합격)
  • 국민대학교 경영대학원 AI빅데이터학과(최종 합격)
  • 국민대학교 소프트웨어융합대학원 인공지능응용학과(최종 합격)
  • 성균관대학교 정보통신대학원 빅데이터학과 (예비 합격)
  • 고려대학교 정보통신대학원 빅데이터융합학과(면접 불합격)
  • 성균관대학교 공과대학 데이터사이언스융합학과(서류 불합격;;)

회사 프로젝트 ‘트렌드 분석 플랫폼’ 완료(사업 관리)

지난 1년간 GS리테일에서 팀 이동, 조직 개편이 각각 1차례씩 있었지만 트렌드 분석 플랫폼이라는 과제는 1년 동안 수행했다. 수행사를 통해 구축한 프로젝트여서 분석 또는 개발 관련한 역량 개발은 솔직히 부족한 편이다. 분석 업무 외적으로 일정 관리, 수요자 인터뷰, 품질 관리, 분석 보고서 작성 등의 업무를 수행했다. 대기업 단위에서 진행하는 프로젝트를 수행할 수 있다는 점은 의미가 있는 것 같다. 실제 본부에서 가장 많이 예산이 투입된 프로젝트 중 하나였다.

트렌드 선행캐칭 PoC 완료. 정기 과제화

트렌드 분석 플랫폼을 통해 앞으로 떠오를 키워드를 볼 수 없는 지에 대해 지시가 있었다. 유통업계는 트렌드에 당연히 민감하고 이미 유명한 트렌드 상품(ex. 약과, 크림빵 등)을 분석해 개발하기보다는 앞으로 유명해질 키워드를 찾는 게 목적이었다. TFT 구성원들끼리는 추상적이기 때문에 정답이 나올 수 없다는 전제 하에 협업을 통해 논리를 만들어 나갔다.
사실 5년 전에 전 회사에서 대한화장품산업연구원에서 유사한 용역을 수행해본 적이 있었다. 송태민 교수님의 ‘소셜 빅데이터 기반 보건복지 정책 미래신호 예측’ 책을 활용했다. ('머신러닝을 활용한 소셜 빅데이터 분석과 미래신호 예측' 책도 구입했었다.) '트렌드 분석 플랫폼'에서 수집된 식품 키워드 데이터를 활용해서 인지도(빈도)는 낮지만 성장률이 높아 유망한 키워드들을 선정했다.
그리고 현업부서로부터 히트상품과 유사한 시계열 추이를 보이는 키워드를 볼 수 있다면 근거로 도움이 될 것 같다는 조언을 얻어, DTW(Dynamic Time Warping)라는 방법론을 추가했다. 두 키워드 간의 시계열 추이가 다르더라도 유클리드 거리 연산을 통해 두 키워드 간의 유사성을 구할 수 있었다.
생각보다 MD분들의 호응이 좋았다. 프로젝트 진행하면서 현업 분들의 반응이 미적지근하거나 알고 있는 걸 준다라는 피드백을 받을 때가 많았었는 데 ‘의미 있고, 적극적으로 활용하겠다’는 메일링을 받아 기분이 좋았다. 임원 보고도 무난히 잘 끝났고, 내년에는 신조어 발굴 알고리즘이나 파이프라인에 올리거나 하는 등으로 발전시킬 계획이다.

빅데이터 분석 기사 필기 합격 (실기 불합격)


빅데이터 분석 기사 필기에 합격했다. 그리고 실기는 떨어졌다. 익숙한 자격증이고, 자격증을 취득한다고 해서 이제는 관련 스킬이 드라마틱하게 는다고 생각하지 않는다. 물론 이렇게 말하지만 실기에 떨어졌다. 변명을 하자면 문제 유형이 바뀐 부분(통계분석)은 대응을 잘 하지 못했고 머신 러닝 코드를 전부 외워서 시험장에서 작성해야 되는 데, GPT에 익숙해진 건지 어려웠다. 자격증에 얽매일 필요가 없다고 생각해서 하반기에는 신청하지 않았다. 내년도에 신청을 할 지는 고민 중이다..

스터디(회사, 오프라인, 온라인)

회사에서 생성형 AI 스터디를 진행하고 있다. 거창해 보이지만 나 같은 초보자와 선임, 상무님도 참여하는 히치하이킹에 가깝다. '트랜스포머를 활용한 자연어 처리'라는 책을 읽다가, 읽기 불편한 구조라는 내용이 많아 중도 하차하고 지금은 '파이썬 텍스트 마이닝 바이블 2'를 읽고 있다. 각자 한 챕터씩 정리해서 발표하고, 질문을 하고 받는다. 그 동안 공부를 할 때는 머신러닝, 딥러닝은 가볍게 이해하고 현업에 맞춰서 코드 따라치는 내용에 그쳤었는데 좀 심도 있는 내용을 많이 이야기한다. (불균형한 데이터셋에서 ROC Curve가 F1 Score보다 중요한 이유, 일반 RNN 대비 트랜스포머의 어텐션의 차이점 등). 회사 업무에 부담이 안가는 선에서 간략한 예제를 실습해보기도 한다.
회사 외적으로도 오픈 카톡방에서 5명 모아서 진행했었고 스터디를 했었다. 근데 금융권 준비하시는 분들은 접점이 너무 없었고 SQLD, 빅분기는 모여서 스터디할 콘텐츠가 아니었다. 다행히 한 분과 공모전 하나를 출품하긴 했지만 더 이어나갈 동력이 없어 종료되었다. 현재는 디스코드로 진행되는 데이터 포트폴리오 스터디를 눈팅하고 있다. 취준생분들의 포트폴리오를 보면서 자극받는 지점이 있어 좋았다.

광진구 빅데이터 공모전

스터디 팀원과 광진구에서 주관하는 빅데이터 자유 공모전에 도전했다. 가산점이 높고, 데이터가 많은 주차/교통 관련해서 주제로 선정했다. 이후 가설에 따라서 최적의 '담장 허물기 주차장'을 세우기 위해 그리드 작업 후 순위를 매기는 작업을 진행했다. 입상에는 실패했다. 내년도에는 공모전보다는 내가 관심있는 분야에 토이 프로젝트 형태로 작업을 해보고 싶다.

데이터 관련 서적 읽기 또는 실습

작년보다 책은 덜 읽었다. 다음과 같은 책을 읽었다.

  • (길벗) 그림으로 이해하는 AWS 구조와 기술 : AWS 용어, 흐름 이해에 도움이 되었다.
  • (정보문화사) 아마존 웹 서비스 AWS Discovery Book : AWS 실습 바이블이라고 들어서 구입. 실습할 때는 어렵지 않다고 느꼈음. 최신 버전하고 다른 지점이 조금 있었음
  • (영진닷컴) 2023 이기적 빅데이터분석기사 필기 기본서 : 특별히 기억나는 지점은 없음
  • (영진닷컴) 2023 이기적 빅데이터분석기사 실기 기본서 : 최신 문제 유형이 반영되어 있지 않았음
  • (동아시아) 챗GPT에게 묻는 인류의 미래 : 독서 모임에서 읽었다. 챗GPT와 채팅한 내용을 토대로 책을 작성했다.
  • (미디어숲) 챗GPT, 질문이 돈이 되는 세상 : 밀리의 서재에서 읽었는데 개론인데 좋았다.
  • (한빛미디어) 트랜스포머를 활용한 자연어 처리 : 스터디에서 구입한 책. 박해선님 기술 번역은 믿어야한다고 구입했었다. 깊이 있는 내용이었는 데 허깅페이스 저자들이 작성한 책이어서 기술 테스트하는 느낌에 가깝다는 의견이 모아졌다.

내년 다짐

이제 주니어 핑계 대기는 부끄러운 경력이 되고 있다. 경쟁력이 있는 데이터 분석가가 되어야 할 텐데 걱정이 앞선다. 2025년에는 조금 덜 부끄러웠으면 좋겠다.

  • 신규 조직에 적응하기. 테크 블로그 기고하기, Agile하게 업무에 임하기
  • 트렌드 선행 캐칭 외에도 신규 과제 만들기
  • 대학원 다니기. 야간 수업 피곤하지만 열심히 듣고, 좋은 원우들과 네트워크 쌓기
  • 채용 공고 읽고 관련 스킬 준비하기(올해 채용 공고를 안 봤다..)
profile
데이터 분석가

1개의 댓글

comment-user-thumbnail
2024년 1월 23일

저도 같은 전공 진학 예정인데 반갑네요~ 한 해 동안 열심히 달리신 것 보고 자극받고 갑니다ㅎㅎ

답글 달기