
데이터 분석 기본 환경을 간단히 소개하고, 설치 및 구축

데이터 사이언스를 학습하기 앞서, 데이터 사이언스의 기본적인 배경 지식을 학습 및 정리
Numpy와 Pandas에 대한 기본적인 이해와 해당 라이브러리를 통한 데이터 탐색 방법 정리

CRUD의 개념과 Pandas의 인덱스 개념을 학습하고, 이를 응용하여 Openapi로 데이터를 호출하여, 데이터 탐색을 수행

Pandas를 이용한 데이터 병합과 연결 방식에 대해 알아본다.

Pandas를 이용한 데이터 그룹핑 방법을 학습한다. (groupby)

시계열 데이터를 정의하고, Pandas를 이용하여 시계열 데이터를 다루는 법을 익힌다.

결측치에 대해 배우고, 결측치를 처리하기 위한 방밥을 알아본다.

이상치의 정의를 알아보고, 이상치를 판단하고, 처리하는 방법을 학습해 본다.

데이터 변환이 무엇이고, 왜 필요한지를 배우고, 데이터 변환 방법을 정규화, 구간화 과정을 통해 익힌다.

데이터 특성 생성의 목적과 필요성을 알고, 데이터 특성을 생성하기 위한 여러가지 방법 (차원 축소, 결합 및 분해, 범주 인코딩)을 배운다.

특성 선택에 대해 알아보고, 특성 선택을 하는 3가지 방법 Filter, Wrapper, Embedded 방식에 대해 실습해본다.

EDA(Exploratory Data Analysis : 탐색적 데이터 분석)이 무엇인지 알아보고, 그 중 일변량 비시각화 탐색 방법을 학습한다.

EDA의 일종인 일변량 시각화 탐색에 대해 배우고, 일변량 시각화를 하기 위한 방법인 파이 차트, 막대그래프, 히스토그램, 커널밀도추정, 박스 플롯을 익힌다.

다변량 비시각화 탐색이 무엇인지 알고, 다변량 비시각화 방안에 무엇인 있는지 실습을 통해 학습한다.

다변량 시각화 탐색의 개념을 배우고, 다변량 시각화 탐색을 하기 위한 방법을 이론 및 실습을 통해 익힌다.

가설 검정이 무엇인지 알고, 가설 검정을 위한 방안들과 프로세스를 익힌다.

변수 간의 상관 관계와 상관 관계의 정도를 확인하기 위한 상관 분석 방법을 배운다. (Pearson, Spearman, 산점도 등을 익힘)

인과 관계 규명에 특화된 회귀 분석의 종류와 특징에 대해 알아본다. 회귀 분석 방법을 배우고, 실습해본다. (Linear regression, log-linear regression, mutiple regression)

시계열 데이터의 특징을 파악하고, 시계열 데이터를 예측하기 위한 분석 모델들을 알아본다.

데이터 시각화에 대해 소개하고, 시각화를 할 수 있는 라이브러리인 Matplotlib과 Seaborn은 간단히 소개한다.

Matplotlib를 이용하여 데이터 시각화하는 방법을 알아본다.

Seaborn을 이용한 데이터 시각화 방식을 알아본다.

동적 시각화가 무엇인지 알아보고, 파이썬을 이용한 동적 시각화 방법에 무엇이 있는지 알아본다.

plotly를 이용하여 데이터를 동적 시각화 하는 방법을 알아본다.

데이터 모델을 웹 애플리케이션으로 보이기 위한 간단한 라이브러리인 Streamlit에 대해 다루어 본다.