데이터분석 종합반은 파이썬 기초 문버부터 데이터를 수집하고, 정제하고, 분석하고, 시각화하는 데이터 분석 과정 전반에 대해 먼저 익숙해지고, 다양한 예제를 통해 데이터로부터 통찰을 얻는 방법 그 자체에 집중했습니다.

77강, 7시간 13분
1주차 [데이터 수집]
엑셀 데이터분석, Python기초, 웹 스크래핑 이해하기
Python, Pandas , HTML, Beautifulsop4
- 엑셀을 통해서 데이터 분석을 한다는 것이 무엇인지 함께 살펴봅니다.
- 본격적인 데이터 분석에 앞서 파이썬 기초 문법을 실습을 통해 익혀봅시다.
- 웹페이로부터 데이터를 추출하기 위해 웹의 구조에 대해 알아봅시다.
- 네이버 뉴스에서 기사 내용, 카테고리 등의 데이터를 스크래핑 해오는 실습을 진행해봅니다.
2주차 [데이터 전처리]
형태소 분석, 워드클라우드, 머신러닝 맛보기
Python, Matplotlib, KoNLPy
- 1주차에서 스크래핑한 텍스트 데이터를 분석하기 좋은 형태로 가공해 봅니다.
- 텍스트 데이터에서 중요한 단어나 키워드를 추출해 시각화하는 워드클라우드를 직접 만들어봅니다.
- 머신러닝 개념 중 텍스트 분류에 대해 알아보고, IMDB 영화 줄거리 데이터를 이용해 장르 분류 실습을 진행해봅니다.
3주차 [데이터 시각화]
판다스 데이터프레임 익숙해지기, 탐색적 데이터분석, 시각화
Python, Matplotlib, Seaborn
- 주류 데이터를 활용해 판다스 데이터프레임 사용 방법에 더욱 익숙해집니다.
- 파이썬 라이브러리
Beautifulsoup4를 이용해 네이버 영화 데이터를 크롤링해옵니다.
- 내 컴퓨터에 데이터베이스를 설치해, 데이터를 쌓고 조작하는 법을 배웁니다.
4주차 [머신러닝]
선형회귀, 값 예측하기, 상관 분석, 정규화
Python, scikit-learn, RMSLE
- 선형 회귀에 대한 개념을 익힙니다.
scikit-learn 패키지를 사용한 선형 회귀 분석을 진행해봅니다.
- 캐글의 자전거 대여 수요 예측 경연에서 사용된 데이터를 사용해 선형 회귀 문제를 풀어봅니다.
- 정규화, 릿지 회귀, 라쏘 회귀 등 다른 종류의 회귀 분석 방법을 다뤄봅니다.
5주차 [실전 데이터분석]
실전! 데이터분석 종합 프로젝트
**Python, left join, K-means
- 현업에서 보게 될 고객 정보 데이터를 가지고 학습해온 기법들을 활용해 종합적으로 분석합니다.
- 데이터를 집계하여 각종 통계량을 파악하여 예측, 분류, 군집을 수행해봅니다.
- 회원 간의 차이를 통해 회원의 탈퇴를 미리 예측해봅니다.
- 회원들의 다음 달의 이용량을 예측해봅니다.