[TIL]데이터 분석 부트캠프(4기) 29일차
0. 들어가며
- 일요일 저녁부터 월요일 준비 잘하기!
- 그 때부터 워밍업을 해 두어야 월요일부터 잘 집중할 수 있을 것 같다!
- 이번주는 못 했는데 다음주에는 꼭 하기!
- Zep 접속 하기 전 아침 루틴 바꾸기!
1. 오전 일과
1-1 코드카타 및 내용 정리
내용 정리 링크
1. https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-35-Monthly-Transactions-I
2. https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-36-Immediate-Food-Delivery-II
- 코드카타 2문제 풀이 완료
- 1번 문제는 sum() 함수와 count() 함수 내에 조건을 추가하여 계산하는 방식
- 이전에 비슷한 문제들을 풀면서 익숙해져서 빠르게 해결!
- 2번 문제는 정확히 왜 모든 Test를 통과했는지 의문..!
- 그리고 해결한 방법으로 가입날짜와 주문날짜가 같은 경우를 범주화하고,
이진형으로 변환 후 문제 해결
- 왜 풀이가 가능한지 코드를 다시 뜯어보기!
1-2 [통계학] 통계야 놀자 라이브 세션
- 2회차 내용에 대한 라이브러리를 활용한 실습
- t-검정 활용시 활용한 라이브러리 : scipy.stats ( 연속형 자료, 표본 갯수가 작을 경우 사용 )
- t, p_val = stat.ttest_ind(df1, df2) 로 t 값과 P-value 값 확인 가능
- 카이제곱 검정 : scipy.stats ( 범주형 자료 )
- stats.chi2_contingency(observed=df)
- 검정통계량, P-value, 자유도 등의 순으로 결과값 도출
2. 오후 일과
2-1 머신러닝 기초 강의
1) 환경 세팅
- VS Code를 기준으로 환경설정 완료
- 개인적으로 나중을 대비하여 Python 3.10.13도 설치 ( Tensorflow 대비 )
- VS Code 내에서 Python 버전을 선택하여 ipynb 파일 실행!
2) 회귀분석 - 선형회귀
- 이론 ( 어려울 땐 1차 방정식으로 생각하면 쉽게 이해 가능 )
- Y는 종속 변수, 결과 변수
- X는 독립 변수, 원인 변수, 설명 변수
- 선형회귀 식
- Y = β0 + β1X + ε
- β0 : 편향(Bias)
- β1X : 회귀 계수
- ε : 오차( 에러 ), 모델이 설명하지 못하는 Y의 변동성
- 머신러닝/딥러닝 에서 사용 시
- Y = ωX + b
- b : 편향(Bias)
- ω : 가중치
- 회귀분석 평가 지표
- MSE ( Mean Squared Erorr )
- R Square
- 활용 라이브러리 ( scikit-learn, numpy, pandas, matplotlib, seaborn)
- 자주 쓰는 함수 ( sklearn.linear_model.LinearRegression )
- coef_ : 회귀 계수
- intercept : 편향(bias)
- fit : 데이터 학습
- predict : 데이터 예측
2-2 Python Basic 2회차 라이브 세션
-
파이썬 공부시 유용한 팁!
- Python Shell 활용, help/dir/type 내장 함수 활용, 다양한 실험 및 공식문서 활용
-
if문, for문 등에 대한 내용
- 연산자, 비교 연산자, in not in, if/elif/else, pass/continue, 문자열 포매팅 등
- 문자열 포매팅 ( 복습하기 )
- %을 활용하는 방법
- %d : 정수형태의 숫자
- %s : 문자열
- %f : 실수
- %x : 16진수
- f 스트링을 활용하는 방법
- .format()을 활용하는 방법
- 예) '{} 님, 안녕하세요.'.format(name)
-
이번 세션에서 가장 유용하다고 생각한 부분
- dir() 내장함수 : 함수가 가지고 있는 모든 attribute에 대한 문자열 리스트 반환
- dir() 내장함수를 활용하면 구글링 없이도 함수의 사용방법에 대해 찾아볼 수 있음!!
3. 마치며
- 9 to 9시간을 최대한 활용하기!
- 21시 이후 시간은 온전히 나만의 시간으로 만들기 위해서 루틴 일부 바꾸기!
- 매번 21시 이후까지 TIL 작성하거나 남은 공부를 하는 경우가 있는데
추가 공부를 하는 건 상관이 없지만 목표를 달성에 대한 나머지 공부는 최대한 지양하고,
시간 내에 완료하도록 노력하기!
- QCC 1~2회 결과 PASS를 받음!!!
- 기분은 좋지만 QCC 당시 깔끔한 쿼리가 아니었기 때문에 계속 공부 및 복습이 필요!