회귀 분석할때 중요한점

생각하는 마리오네트·2022년 2월 13일
0

통계

목록 보기
37/41

1. 측정하고자 하는 변수를 수치화 할 수 있는 변수로 바꾸는것

  • 우리는 회귀 분석을 할 때 다양한 독립변수 혹은 단일의 독립변수 X 를 통해서 목표하는 종속변수 Y를 구해야 하는데 이때 우리가 종속변수를 예측할때 어떠한 요인을 통해서 예측을 할 것인가를 정하는 것은 매우 중요하다. 하지만 많은 초보자분들(본인포함)이 신경을 덜 쓰는것 중 하나가 정한 변수를 어떻게 수치화 변수로 바꿀지 에 대해서는 오래 고민을 하지않는다. 좋은 변수를 찾았다고 해도 이를 적절하게 수치화 시키지 않는다면 이것이 과연 종속변수를 예측하는데 도움이 되는 독립변수일까....?? 생각해 보고 이에 시간을 적절하게 투자하는것이 좋을것 같다.

2. 요인분석을 하고 어떠한 지표, 혹은 결과가 나왔을 때 왜 이러한 결과가 나왔을지 해석하는것이 중요하다.

  • 즉, 데이터만 가지고 생각을 하지 않고 넓게 생각하여 해석을 접근해야한다.
  • 예를 들어 인구에 영향을 미치는 요인들을 분석할 때 주택 가격이 양의 상관관계를 가지는 것을 확인했을때 "주택 가격과 인구는 양의 상관관계를 가지는구나" 라고 끝을 맺는 것이 아니라, "인구가 유입이 되면 주택가격이 상승하겠네?? 그래서 이러한 결과가 나왔구나." 라고 해석을 하는 것이 중요하다.
  • 요약하면 너무 수치에 매몰되지 않고 직접 생각을 해보는 것이다. 이러한 이유때문에 사전에 탄탄한 가설들을 세우는데 시간을 많이 사용해서, 분석하기전에 "인구유입에따라 주택가격이 변화할 수 있겠다" 라는 가설을 세우고 분석 후 "우리 가설이 맞을 확률이 높겠다." 라는 결론으로 흐름을 가져가면 더 좋을것같다.
profile
문제를해결하는도구로서의"데이터"

0개의 댓글