Understanding Data Characteristics 데이터 분석을 시작하기전, 다루고 있는 데이터를 철저히 이해해야 한다. 다루는 데이터에 대한 철저한 이해는 분석 방법을 선택하고 적용하는 것의 기반이 된다. 고려해야할 특성들은 아래와 같다. >- 데이터 타입 : 데이터의 타입이 이산적인지, 비율인지, 명목형 등등 중에서 어떤 것인지 아는것은 올...
다변량 데이터 분석을 위한 표본추출 방법, 기술통계, 사분위수 범위(IQR), 왜도, 첨도, 그리고 데이터 스케일링 개념에 대해
Data Wrangling? 데이터 랭글링(Data Wrangling)은 원천 데이터를 준비하여 분석이나 모델링에 사용할 수 있는 형태로 변환하는 과정을 말한다. 이전에는 주로 데이터 정제(cleansing)라고 하며, 정형화된 데이터를 준비하는 데 사용되던 말이다.

Probability vs. Likelihood , code implement
Probability Error, Law of Large Numbers, Expected Value, Standard Error, Binomial and Bernoulli Distributions
Bootstrap, 심슨의 역설 이론 및 코드구현
유의성 검정과 가설 검정
Z-Test, T-Test, Chi-Square Test 예제 모음
Understanding and Applying Type I and Type II Errors
Correlation and Regression with code
RMSE, MSE, MAE