[TIL]데이터 분석 부트캠프(4기) 35일차
0. 들어가며
- 라이브 세션 강의 때 졸았다...
- 오후 2시는 조금 어렵다..
- 앞으로는 강의나 공부 중에 잠들지 않기 위해 계속 노력하자!
1. 오전 일과
1-1. 코드타카 및 내용 정리
내용 정리 링크
https://velog.io/@dav74/%EC%BD%94%EB%93%9C%EC%B9%B4%ED%83%80-SQL-49-Product-Price-at-a-Given-Date
- 코드카타 1문제 풀이 완료
- Join을 통해서 최근 change_date 구하기가 중요! ★★
- 최근 change_date를 어떻게 불러오는지에 대해 다시 복습하기!
2. 오후 일과
2-1. 머신러닝 빌드업 라이브 세션 - 3회차
내용 정리 링크
https://velog.io/@dav74/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%EB%B9%8C%EB%93%9C%EC%97%85-03
- 머신 러닝 모델링의 전체적인 프로세스
- 문제 정의
- 데이터 전처리
- 데이터 수집, 데이터 클리닝, 피쳐 엔지니어링, 데이터 분할
- 모델링
- 모델 생성, 학습, 모델을 통한 예측, 성능 평가, 모델 성능 최적화
- 배포
2-2. 머신러닝 특강 - 분류분석
내용 정리 링크
https://velog.io/@dav74/%EB%A8%B8%EC%8B%A0%EB%9F%AC%EB%8B%9D-%ED%8A%B9%EA%B0%95-01-%EB%B6%84%EB%A5%98-%EB%B6%84%EC%84%9D
2-3. Python Basic - 5회차
-
파이썬 문제 풀이를 더 잘 할 수 있는 방법
1) 문제를 정확히 이해
2) 문제를 작은 단계로 나눠보기
3) 적절한 알고리즘과 자료구조를 선택
4) 코드를 구현
5) 디버깅 및 최적화 시도
-
스터디 전략
1) 문제를 풀기 위해 필요한 기본 문법과 사고 방식 익히기
- 파이썬 문법과 함수들을 배우는 것과 코딩 테스트 문제를 푸는 것은 본질적으로 다름
- 도구를 이해하는 단계 → 도구를 사용해 실제로 결과를 만들어내는 단계
- 무작정 시작하며 어떻게 도구를 사용 해야 될 지 모르겠다면 다른 사람들이 도구를 사용해 만들어내는 과정을 보고 따라 하기!
2) 문제를 반복해서 풀기
- 여러번 반복해서 풀어보고 풀이 과정과 패턴을 몸으로 익히기, 익숙해지면 새로운 문제에서도 응용
- 같은 문제를 다른 방식으로 풀어보고 사고력 확장
- 문제를 어떻게 해결할지 구조적으로 생각하는 습관
3) 오답 분석
- 풀지 못한 문제를 읽고 이해한 다음 다시 풀어보기
- 왜 처음에는 못 풀었고 당시 어떤 개념이 부족했는지 인지하기
4) 성공 경험 축적
- 쉬운 문제를 꾸준히 풀며 성취감을 느끼자 - 작은 목표 설정: 하루 한 문제 풀기 등
- 문제 푸는 과정에 대한 즐거움을 찾고 좌절감을 극복하기
-
데이터 집계 및 요약
- Groupby와 집계
- 그룹별 집계( groupby().agg(), groupby().apply() )
- 다중 집계 함수( agg({'col1': 'mean', 'col2' : ['sum','max']} )
- 피벗 테이블
- pivot_table 활용
- 교차표 생성( crosstab )
- 데이터 프레임 결합
- 병합 ( merge )
- 연결 ( concat, append )
- 중복 데이터 제거 및 관리 ( drop_duplicates )
3. 마치며
- 강의 중 또는 공부 중에 잠드는 건 요즘 집중력과 열정이 부족하는 것이다.
- 지금의 시간이 앞으로 성장의 발판이 되는 만큼 매 순간 최선을 다하자!
- 졸리면 잠을 깨려는 노력을 하고, 저작운동을 통해 졸음을 깨자!