정형 데이터

hoegon kim·2022년 10월 24일

Python

목록 보기
10/18
post-thumbnail

정형 데이터 일때 두변수간의 관계

산점도
2개의 변수간의 관계를 파악하기 위하여 좌표평면 위에 점을 찍어 만든 그래프 산포도 또는 분산형 당어그램이라고도 불립니다.

데이터간의 관계를 알고싶을때 (논리적 타당성)

이후 상관관계를 분석을하고-> 기술통계 -> 회귀분석

단순회귀분석의 개요
개념 : 상관관계분석은 두 변수간의 선형관계를 조사하는 것이지만, 단순선형회귀분석(simple linear regression; 이하 단순회귀분석)은 두 변수간의 인과관계(casual relationship)를 조사하는 방법임.

독립변수(예측변수) : 영향을 미칠 것으로 생각되는 변수.

종속변수(기준변수) : 영향을 받을 것으로 생각되는 변수.

→ 두 변수간의 관계에서 독립변수와 종속변수의 설정은 어디까지나 논리적 타당성을 토대로 해야 하며, 논리적 타당성과 함께 자료분석 결과 독립변수로 설정된 변수의 변화에 따라 종속변수로 설정된 변수의 변화가 있는 것으로 나타나면 비로소 두 변수간의 인과관계가 있는 것으로 추정할 수 있으나, 논리적 근거가 없이 어떤 임의의 두 변수 중 하나를 독립변수, 다른 하나를 종속변수로 설정하여 회귀분석 결과 독립변수의 계수가 통계적으로 유의적이라 하더라도 두 변수간에 인과관계가 있다고 주장할 수는 없는 것임(회귀분석의 결과 만으로는 결코 인과관계를 규명할 수 없음).

단순회귀분석의 가장 기본적인 과업은 과 을 구하는 것이며, 기본식은 다음과 같다.

0개의 댓글