[TIL] 자유도가 뭐지?

cjkangme·2023년 2월 11일
0

TIL

목록 보기
8/37
post-thumbnail

자유도 (Degree of Freedom)

품질경영기사 때도, 데이터 분석을 배우면서 자유도라는 개념을 접했다.

그저 자유도는 n-1이다 라는 정도로만 기억하고 있는데, 도대체 자유도가 무슨 개념이지? 왜 자유도라고 하는 것이지?가 궁금해져 찾아보았다.

정의

위키백과 : 통계학에서 자유도(自由度, degrees of freedom,df)는 통계적 추정을 할 때 표본자료 중 모집단(x)에 대한 정보를 주는 독립적인 자료의 수를 말한다.

네이버 : 표본을 구성하고 있는 개별요소 중 주어진 조건하에서 통계적 제한을 받지 않고 자유롭게 변화될 수 있는 요소의 수

나무위키 : 추정해야 할 미지수의 개수를 내가 가진 정보의 수에서 뺀 값

쉬운 설명

자유도는 쉽게말하면, 주어진 수식 내에서 우리가 자유롭게 선택할 수 있는 값이라 할 수 있다.

x1 + x2 + x3 = 10

위 수식에서 x1 = 3, x2 = 2 와 같이 2개의 임의의 수를 자유롭게 선택할 수 있다.
x2 = 5000, x3 = 10000 이런 선택도 가능하다

이렇게 두 수를 선택하면 자연히 남는 한 변수는 다른 두 변수의 의해 값이 고정된다.
첫번째 경우에서 x3 = 5, 두번째 경우에서 x1 = -14990이다.

이렇게 자유롭게 선택할 수 있는 변수가 2개이기 때문에, 이 경우에 자유도는 2이다.

대부분의 통계 계산에서 자유도가 n-1인 이유가 여기에 있다.
표본의 수 n-1개까지는 자유롭게 변화가 가능하지만, 나머지 1개는 고정되기 때문이다.

네이버의 표본을 구성하고 있는 개별요소 중 주어진 조건하에서 통계적 제한을 받지 않고 자유롭게 변화될 수 있는 요소의 수 설명이 이와 유사하다.

독립 개념

여기서 x1, x2는 서로 아무런 관련이 없다. 즉, 독립이다.

반면 x3는 x1, x2에 의해 결정되는 종속변수이다.

위키백과의 설명 통계적 추정을 할 때 표본자료 중 모집단(x)에 대한 정보를 주는 독립적인 자료의 수를 말한다.에서 독립적인 자료가 바로 x1, x2를 가리키는 말이다.

추정치 개념

x1, x2, x3가 표본 데이터라고 하자.

평균 x-bar는 x1, x2, x3에 의해 만들어진 모수의 추정치이다.

여기서 자유도는 내가 알고있는 데이터(x1, x2, x3)의 수 3에서
추정치(x-bar, 또는 m)의 수 1을 뺀
2라는 결과가 나온다.

나무위키의 설명 추정해야 할 미지수의 개수를 내가 가진 정보의 수에서 뺀 값은 이것과 비슷하다.

그러면 왜 추정치를 뺄까?

분산을 구하는 식에서 제곱을 제거한 수식은 아래와 같다.

x-bar 자체가 (x1 + x2 + x3) / 3에서 나온 것이므로 값이 무조건 0으로 고정된다.

즉 이 경우는 자유도가 0이라 할 수 있다. 추정치로 인해 수식의 자유도가 내려간 것이다.

대략적으로 추정치는 자유도에 악영향?을 주기 때문에 빼는 것이라 생각하자
자세히 알기 위해서는 선형대수학으 배워야한다(고 한다)

참고 영상

수식없는 자유도 설명 영상

0개의 댓글

관련 채용 정보