: 통계기반 데이터 분석 : 2023.03.15 ~ 2023.03.20 (평일 기준 3일) : 미국 50개 주에 대한 통계데이터에 대한 다중회귀분석 \- 전세계 코로나 발생 현황 데이터에 대한 시계열 분석 - 대상 기간: 2020.03 ~ 2022.07 (일별 데이터
\- 사용 데이터: state.x77 - names(): 인구수, 수입, 문맹률, 기대수명, 범죄율, 고졸, 결빙일수, 면적 <span style="color: state.x77 데이터 일부 확인
시계열 분석이란? 시간에 따라 측정된 데이터의 패턴, 동향 및 예측을 이해하기 위한 통계적인 분석 방법으로 시계열 데이터로부터 추세, 계절성, 주기성 등의 패턴을 식별하고, 데이터의 특성을 이해하며, 예측 모델을 구축할 수 있다. 시계열 분석에는 다양한 기법들이 사용
로지스틱 회귀분석이란? 종속 변수가 이항적인 경우(두 개의 범주를 가지는 경우)에 사용되는 통계적 분석 방법으로 종속 변수와 독립 변수간의 관계를 모델링하고 독립 변수의 값에 따라 종속 변수가 속하는 범주를 예측하는 데 사용됩니다. 분류 문제에 널리 활용되며 예측 모
분석 목적을 설정하고, 그에 맞는 분석 방법을 선택하여 모델을 생성한 후 모델을 다듬는 과정을 통해 많은 양의 데이터가 필요하다는 것을 느꼈습니다. 또한, 데이터 분석시 종속변수와 유의미하다고 보이지 않던 변수들이 예측 및 평가시 영향을 미치는 경우도 있었고 그 반대