[TIL]데이터 분석 부트캠프(4기) 30일차
0. 들어가며
- 아침 루틴 일부 변경 완료!
- 추가적으로 개선 필요!
- 정해진 시간에 최대한 집중하기!!!
1. 오전 일과
1-1 코드카타 및 내용 정리
내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-37-Game-Play-Analysis-IV
- 코드카타 1문제 풀이 완료
- 문제를 잘 읽기..!
- 문제 상에 처음 로그인한 일과 다음 날까지 연속접속한 player_id를 구하는 것인데
- min() 함수를 활용하니 답 도출..!
- 작은 부분에 대해서도
1-2 [통계학] 라이브 세션
- 내용 정리는 오후에 진행하여 정리 링크는 하단에..!
2. 오후 일과
2-1 라이브 세션 복습 및 내용 정리
내용 정리 링크
https://velog.io/@dav74/%ED%86%B5%EA%B3%84%ED%95%99-%ED%86%B5%EA%B3%84%EC%95%BC-%EB%86%80%EC%9E%90-04
- 회귀 분석
- 선형회귀분석
- 로지스틱회귀분석
- 3단계를 통한 분석 진행
- 독립변수, 종속변수 설정 + 가설 설정
- 데이터 경향성 확인
- 정합성 검증 & 결과 해석
2-2 아티클 스터디
내용 정리 링크
https://velog.io/@dav74/%EC%95%84%ED%8B%B0%ED%81%B4-%EC%8A%A4%ED%84%B0%EB%94%94-%EA%B8%B0%ED%9A%8D%EC%9E%90%EA%B0%80-%EC%95%8C%EC%95%84%EC%95%BC-%ED%95%A0-%EB%8D%B0%EC%9D%B4%ED%84%B0-%EB%B6%84%EC%84%9D-%EB%8F%84%EA%B5%AC%EC%99%80-%ED%99%9C%EC%9A%A9%EB%B2%95
- 데이터 분석 도구는 '의사결정'에 도움을 주는 도구로서 활용하고,
기획자로서 데이터 분석 도구를 통해 올바른 의사결정하는 것이 중요하다!
2-3 Python Basic 3회차 라이브세션
- While 문
- 조건문이 참이면 계속해서 반복 실행 ( 무한 루프에 걸릴 수 있으니 주의! )
- While문 강제로 빠져나가기 → break
- continue 문
- 조건이 True ( or False) 일 경우 단계를 넘기고 반복문의 시작으로 되돌아가기!
- While문 vs For 문
- While - 조건에 따른 반복 횟수가 동적으로 결정, 조건을 미충족시 무한 루프
- For - 고정된 반복 구조 수행, 주어진 반복 횟수가 끝나면 자동 종료
- Pandas의 Series, DataFrame, 데이터 로드
- Series와 DataFrame이라는 두 가지 기본 데이터 구조를 제공하여 저장 및 조작할 수 있는 라이브러리
- Series : 1차원 배열
- DataFrame : 2차원 데이터 구조 ( Excel 데이터 시트 ) 와 같다
- index, columns, values, dtypes, T, shape 등을 통한 데이터 기초 분석 가능
- ()의 여부 : 있으면 - 함수 실행 / 없으면 - 함수 참조
- pd.read_csv('파일명') 으로 데이터 불러오기!
- encoding 형식 ( euc-kr, utf-8, cp949, utf-8-sig 등 )
- DataFrame 메서드
- 조회 및 탐색 : head(), tail(), describe(), info()
- 데이터 선택 및 필터링 : loc[], iloc[], query(), filter()
- 데이터 조작 및 변형 : append(), drop(), rename(), melt(), pivot()
- 정렬 및 그룹화 : sort_values() sort_index(), groupby()
- 결합 및 병합 : concat(), merge(), join()
- 결측치 처리 : isnull(), notnull(), fillna(), dropna()
- 통계 및 계산 : mean(), median(), sum(), std(), corr()
- 변형 및 재구성 : pivot(), pivot_table(), stack(), unstack()
- 시계열 데이터 처리 : resample(), asfreq(), rolling()
- loc vs iloc의 차이
- loc : 행과 열의 라벨(이름)을 사용하여 데이터를 선택
- iloc : 행과 열의 정수 위치를 사용하여 데이터를 선택
3. 마치며
- 학습 주차로 통계와 머신러닝과 관련 내용에 대해 반복해서 학습 중..!
- 분명 계속 들었던 내용들이라는 느낌을 받고 있음..!
그러니 개념을 확실히 하여 잊지말고 정확하게 숙지할 필요가 있다!!
- 그리고 금요일 QCC를 대비하여 SQL 코드카타 복습도 꾸준히 하기!