TIL(24.04.19.)

codataffee·2024년 4월 19일

TIL

목록 보기
11/135
post-thumbnail

#INTRO

POSITIVE NEW DAY!

본 캠프 5일차, 발표영상 제작으로 늦게 잤더니 너무 피곤하네ㅋㅋ


#코드카타 (09:00 ~ 10:00)


#주간 스크럼 (10:00 ~ 10:30)

온보딩 주차 마지막 날로 2시에 있을 발표에 대비해 발표 스크립트를 수정하는 시간을 가졌다.
발표영상 녹화 결과, 8분이 넘어가는 내용을 7분 이내로 줄이면서 정리하다 보니
이번 주 프로젝트를 위해 시도했던 내용들이 생각나면서 직접 하지 못했던 분석들을
빨리 능력을 키워서 직접 해보고 싶다는 생각을 했다.


#프로젝트 발표 (14:00 ~ 16:00)

  • 발표하기로 했던 팀원의 화면공유가 되지 않는 이슈로 식은땀이 살짝 났지만,
    잘 대처하고 발표도 마무리했다.ㅋㅋ
  • 다른 조들의 발표 자료를 보면서 같은 데이터를 가지고 저렇게도 할 수 있구나.
    많은 것을 보고 느끼는 좋은 시간이었다.
  • 프로젝트 전체를 첨부하지는 않겠지만 발표 후 튜터님들의 피드백을 정리해보았다.
    주로 분석을 진행하면서 막막했던 부분에 대한 내용들이라 도움이 많이 될 것 같다.

    전략 및 목표 설정 부분
    가설 설정: 데이터 탐색에서 시작해 가설을 설정하고, 이를 바탕으로 분석을 진행한 후 결과 도출.
    구체적 목표 설정: 목표를 구체적으로 설정하고, 데이터를 여러가지 방법들로 분석을 확장한 후, 좁혀나가는 과정으로 문제 해결 방안을 도출.
    액션 아이템 강조: 분석 목표가 될 액션 아이템을 보고서 초반부터 강조.
    분석 및 결과 도출 부분
    상관계수 산출 관련: 상관계수(피어슨) 산출 과정을 명확히 밝히고, 통계적 분석에 활용.
    드라마틱한 부분 강조: 분석에서 드라마틱한 부분과 보고서의 핵심 내용 강조.
    디자인 및 프레젠테이션 부분
    폰트 관리: 보고서의 폰트가 깨지지 않도록 주의.
    색상 사용: 단색보다는 눈에 띄는 색깔을 사용하여 중요한 부분을 하이라이트.
    디테일 표시: 단위와 같은 세부 사항을 더욱 상세하게 표시.
    시각화 자료: 테이블보다는 시각화 자료를 사용하여 정보를 전달.
    마케팅 및 판매 전략 부분
    판매전략: 이익 중심의 접근보다는 다양한 변수들을 고려하여 전략 수립.
    대안의 구체성: 제시된 대안을 더욱 구체적이고 상세하게 작성.
    스토리텔링
    스토리텔링: 데이터와 분석 결과를 통해 이야기를 전달하는 데 더 많은 노력 필요.


#SQL 세션 (17:00 ~ 18:00)

▼ 핵심 내용 정리

  • 데이터 직군의 분류

    1. Data Engineer : 데이터 저장 및 관리
    2. Data Analyst : 데이터 추출, 가공, 시각화 통한 인사이트 도출
    3. Data Scientist : 모델 개발 및 최적화
  • 차별화된 Data Analyst

    1. 기본 역량 (SQL + Python, Visualization Tool)
    2. 도구 활용 능력 키우기
      Language : Python, SQL, R
      Database Tool : Amazon, Google Bigquery, Dbeaver, MySQL Workbench
      Data Analysis Tool : Jupyter Notebook
      Data Visualization Tool : Tableau, Jupyter Notebook
    3. Data Analyst + Data Scientist 능력 둘다 갖추기
  • SQL 쿼리 작동순서

    FROM – ON – JOIN – WHERE – GROUP BY – HAVING – SELECT – DISTINCT – ORDER BY


#야간 스크럼 (20:00 ~ 20:30)

먼저, 팀에 분석 관련 복수전공을 한 팀원이 있어서 
이번 프로젝트 간 사용했던 분석 방법들을 배우는 시간을 가졌다.

데이터 전처리 과정

  • 데이터 불러오기

  • 데이터 정보 보기

  • 데이터 정제

  1. Date 포맷 변경

  2. 컬럼명 내 공백과 - 기호 치환

  3. 미사용 컬럼(Product_name) 제거

  • 수정된 데이터 저장

데이터 탐색 및 시각화 과정

  • 라이브러리 불러오기

  • 기술통계량 분석

  • 데이터 분포 확인

  • 박스플롯 도식

  • 피어슨 상관관계 분석

  • 막대그래프 도식

이 외에도 지도 시각화, 히트맵, 산점도 등 다양한 분석방법을 보여줬으나,
현재 내 파이썬 스킬로는 따라가기 벅차 이 정도에서 마무리했다.


  • 주간회고로 온보딩 1주차 프로젝트 학습 마무리.
온보딩 1주차 미니 팀 프로젝트를 무사히 마쳤습니다. 
처음엔 무엇을 해야 하는지, 지금 하는 것들이 잘 하고 있는 것인지도 모른 채 
불안한 마음이 컸지만 팀원들과 함께 사소한 의견들도 공유하고 배우며 
프로젝트에 집중하다 보니 5일이 금세 지나갔습니다.

이번 프로젝트를 통해 데이터를 활용해서 데이터 분석을 진행하는 
전체적인 큰 그림을 그릴 수 있었고, 막연히 상상만 하던 분석 과정을 
직, 간접적으로 체험할 수 있어서 많은 것을 느끼고 배울 수 있었다고 생각합니다. 
튜터님들과 팀원들과의 피드백, 의견 공유 내용들을 잘 정리해서 
성장의 밑거름으로 사용하겠습니다.

#OUTRO

오늘의 한 줄.

주말 푹 쉬고 체력 관리 잘 해서 다음주도 열심히 달려보자!

profile
커피 좋아하는 데이터 꿈나무

0개의 댓글