데이터 분석 커리큘럼

addison·2022년 4월 1일
0

데이터 분석

목록 보기
1/48

데이터분석 종합반은 파이썬 기초 문버부터 데이터를 수집하고, 정제하고, 분석하고, 시각화하는 데이터 분석 과정 전반에 대해 먼저 익숙해지고, 다양한 예제를 통해 데이터로부터 통찰을 얻는 방법 그 자체에 집중했습니다.

77강, 7시간 13분

1주차 [데이터 수집]

엑셀 데이터분석, Python기초, 웹 스크래핑 이해하기

Python, Pandas , HTML, Beautifulsop4

  • 엑셀을 통해서 데이터 분석을 한다는 것이 무엇인지 함께 살펴봅니다.
  • 본격적인 데이터 분석에 앞서 파이썬 기초 문법을 실습을 통해 익혀봅시다.
  • 웹페이로부터 데이터를 추출하기 위해 웹의 구조에 대해 알아봅시다.
  • 네이버 뉴스에서 기사 내용, 카테고리 등의 데이터를 스크래핑 해오는 실습을 진행해봅니다.

2주차 [데이터 전처리]

형태소 분석, 워드클라우드, 머신러닝 맛보기

Python, Matplotlib, KoNLPy

  • 1주차에서 스크래핑한 텍스트 데이터를 분석하기 좋은 형태로 가공해 봅니다.
  • 텍스트 데이터에서 중요한 단어나 키워드를 추출해 시각화하는 워드클라우드를 직접 만들어봅니다.
  • 머신러닝 개념 중 텍스트 분류에 대해 알아보고, IMDB 영화 줄거리 데이터를 이용해 장르 분류 실습을 진행해봅니다.

3주차 [데이터 시각화]

판다스 데이터프레임 익숙해지기, 탐색적 데이터분석, 시각화

Python, Matplotlib, Seaborn

  • 주류 데이터를 활용해 판다스 데이터프레임 사용 방법에 더욱 익숙해집니다.
  • 파이썬 라이브러리 Beautifulsoup4를 이용해 네이버 영화 데이터를 크롤링해옵니다.
  • 내 컴퓨터에 데이터베이스를 설치해, 데이터를 쌓고 조작하는 법을 배웁니다.

4주차 [머신러닝]

선형회귀, 값 예측하기, 상관 분석, 정규화

Python, scikit-learn, RMSLE

  • 선형 회귀에 대한 개념을 익힙니다.
  • scikit-learn 패키지를 사용한 선형 회귀 분석을 진행해봅니다.
  • 캐글의 자전거 대여 수요 예측 경연에서 사용된 데이터를 사용해 선형 회귀 문제를 풀어봅니다.
  • 정규화, 릿지 회귀, 라쏘 회귀 등 다른 종류의 회귀 분석 방법을 다뤄봅니다.

5주차 [실전 데이터분석]

실전! 데이터분석 종합 프로젝트

**Python, left join, K-means

  • 현업에서 보게 될 고객 정보 데이터를 가지고 학습해온 기법들을 활용해 종합적으로 분석합니다.
  • 데이터를 집계하여 각종 통계량을 파악하여 예측, 분류, 군집을 수행해봅니다.
  • 회원 간의 차이를 통해 회원의 탈퇴를 미리 예측해봅니다.
  • 회원들의 다음 달의 이용량을 예측해봅니다.

0개의 댓글