[TIL]데이터 분석 부트캠프(4기) 29일차

Data_Student·2024년 11월 18일
0

TIL

목록 보기
29/54

[TIL]데이터 분석 부트캠프(4기) 29일차


0. 들어가며

  • 일요일 저녁부터 월요일 준비 잘하기!
  • 그 때부터 워밍업을 해 두어야 월요일부터 잘 집중할 수 있을 것 같다!
  • 이번주는 못 했는데 다음주에는 꼭 하기!
  • Zep 접속 하기 전 아침 루틴 바꾸기!

1. 오전 일과

1-1 코드카타 및 내용 정리

내용 정리 링크
1. https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-35-Monthly-Transactions-I
2. https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-36-Immediate-Food-Delivery-II

  • 코드카타 2문제 풀이 완료
    • 1번 문제는 sum() 함수와 count() 함수 내에 조건을 추가하여 계산하는 방식
    • 이전에 비슷한 문제들을 풀면서 익숙해져서 빠르게 해결!
    • 2번 문제는 정확히 왜 모든 Test를 통과했는지 의문..!
    • 그리고 해결한 방법으로 가입날짜와 주문날짜가 같은 경우를 범주화하고,
      이진형으로 변환 후 문제 해결
    • 왜 풀이가 가능한지 코드를 다시 뜯어보기!

1-2 [통계학] 통계야 놀자 라이브 세션

  • 2회차 내용에 대한 라이브러리를 활용한 실습
    • t-검정 활용시 활용한 라이브러리 : scipy.stats ( 연속형 자료, 표본 갯수가 작을 경우 사용 )
    • t, p_val = stat.ttest_ind(df1, df2) 로 t 값과 P-value 값 확인 가능
    • 카이제곱 검정 : scipy.stats ( 범주형 자료 )
    • stats.chi2_contingency(observed=df)
    • 검정통계량, P-value, 자유도 등의 순으로 결과값 도출

2. 오후 일과

2-1 머신러닝 기초 강의
1) 환경 세팅

  • VS Code를 기준으로 환경설정 완료
  • 개인적으로 나중을 대비하여 Python 3.10.13도 설치 ( Tensorflow 대비 )
  • VS Code 내에서 Python 버전을 선택하여 ipynb 파일 실행!

2) 회귀분석 - 선형회귀

  • 이론 ( 어려울 땐 1차 방정식으로 생각하면 쉽게 이해 가능 )
    • Y는 종속 변수, 결과 변수
    • X는 독립 변수, 원인 변수, 설명 변수
    • 선형회귀 식
      • Y = β0 + β1X + ε
      • β0 : 편향(Bias)
      • β1X : 회귀 계수
      • ε : 오차( 에러 ), 모델이 설명하지 못하는 Y의 변동성
    • 머신러닝/딥러닝 에서 사용 시
      • Y = ωX + b
      • b : 편향(Bias)
      • ω : 가중치
  • 회귀분석 평가 지표
    • MSE ( Mean Squared Erorr )
    • R Square
      • SST = SSE + SSR
  • 활용 라이브러리 ( scikit-learn, numpy, pandas, matplotlib, seaborn)
  • 자주 쓰는 함수 ( sklearn.linear_model.LinearRegression )
    • coef_ : 회귀 계수
    • intercept : 편향(bias)
    • fit : 데이터 학습
    • predict : 데이터 예측

2-2 Python Basic 2회차 라이브 세션

  • 파이썬 공부시 유용한 팁!

    • Python Shell 활용, help/dir/type 내장 함수 활용, 다양한 실험 및 공식문서 활용
  • if문, for문 등에 대한 내용

    • 연산자, 비교 연산자, in not in, if/elif/else, pass/continue, 문자열 포매팅 등
    • 문자열 포매팅 ( 복습하기 )
      • %을 활용하는 방법
        • %d : 정수형태의 숫자
        • %s : 문자열
        • %f : 실수
        • %x : 16진수
      • f 스트링을 활용하는 방법
        • 예) f'{name} 님, 안녕하세요'
      • .format()을 활용하는 방법
        • 예) '{} 님, 안녕하세요.'.format(name)
  • 이번 세션에서 가장 유용하다고 생각한 부분

    • dir() 내장함수 : 함수가 가지고 있는 모든 attribute에 대한 문자열 리스트 반환
    • dir() 내장함수를 활용하면 구글링 없이도 함수의 사용방법에 대해 찾아볼 수 있음!!

3. 마치며

  • 9 to 9시간을 최대한 활용하기!
  • 21시 이후 시간은 온전히 나만의 시간으로 만들기 위해서 루틴 일부 바꾸기!
  • 매번 21시 이후까지 TIL 작성하거나 남은 공부를 하는 경우가 있는데
    추가 공부를 하는 건 상관이 없지만 목표를 달성에 대한 나머지 공부는 최대한 지양하고,
    시간 내에 완료하도록 노력하기!
  • QCC 1~2회 결과 PASS를 받음!!!
  • 기분은 좋지만 QCC 당시 깔끔한 쿼리가 아니었기 때문에 계속 공부 및 복습이 필요!

0개의 댓글