[회귀 분석] Matrix approach to simple linear regression

그렘린·2022년 8월 6일
1

회귀 분석

목록 보기
9/9

multiple regression을 하기 위해서는 행렬과 선형대수 관련 내용을 필수적으로 알고 있어야 한다. 이번 포스팅에서는 행렬 관련한 간단한 지식들을 다룰 예정이다.

최근에 너무 바빠서 글을 잘 작성하지 못했다... 지금도 사실 할 일이 계속 있는데... 그래도 이번주에 너무 포스팅을 하지 않아서 조금씩 해보려고 한다!

Matrix의 정의

: 원소를 직사각형 모양을 행과 열로 나열한 것


요렇게 표현이 가능하다.

square matrix : 정사각 행렬, 행의 num과 열의 num이 같다.

column vector : 열이 하나만 있는 matrix

Row vector : 행이 하나만 있는 matrix

Transpose 란?

matrix에서 행과 열을 바꾸는 것.
다음과 같이 표현할 수 있다.

일반적으로 쓰면, A=(aij)A = (a_{ij}) 이고 AT=(Aji)A^T = (A_{ji}) 이다.

이제, matrix를 이용해 SLR (simple linear regression) 을 표현해보자!

Matrix apporach to SLR

regression example을 살펴보자.
우선 Design matrix의 구조에 대해 이해할 필요가 있다.

Design matrix란? : 맨 첫번째 열이 1로만 구성된 행렬이다.이는 intercept를 표현하기 위함으로 존재하는 것이고, 전체 predictor수에 1을 더한 것이 행의 수가 된다.

Matrix addition and subtraction

더하기, 빼기와 같은 구조에서는 단순히 같은 위치일때 더하고, 빼면 된다!
A=(aij)A = (a_{ij}), B=(bij)B=(b_{ij}) 일때 A+B=(aij+bij),AB=(aijbij)A+B = (a_{ij}+b_{ij}) , A-B = (a_{ij}-b_{ij})

ex

그렇다면 이제 식을 표현해보자.

Yi=E(Yi)+ϵiY_i = E(Y_i)+\mathit{\epsilon}_i
이를 헹렬로 표현하면 Y=E(Y)+ϵY = E(Y) +\mathit{\epsilon} 이 된다.

Multiplication of a matrix

A=(aij)A = (a_{ij}) 이고 kk 가 scalar라면
kA=Ak=(kaij)kA = Ak = (ka_{ij}) 이다.

matrix 끼리의 곱

위와 같은 행렬이 있을 때, 우리는 A의 첫번째 행과 B의 첫번째 열을 cross product한 값을 곱의 첫 원소로 적어준다.
이런 방식으로 계산을 해나가면 된다!


이러한 이유로 행렬을 곱계산할때는 반드시 숫자가 매치되어야한다.

이를 regression example로 살펴보면 다음과 같다.

앞의 Matrix는 design matrix이고 뒤에는 우리가 추정할 계수이다.

더 중요한 부분은 내일 다루겠다..!

1개의 댓글

comment-user-thumbnail
2022년 10월 5일

선배~ 안녕하세요!!
요즘 ㅇㅈㄱ 교수님 회귀분석 수업 들으면서
이해되는 게 거의 없어서…ㅠㅠ
참고할 만한 것 서치하다가 선배가 작성하신 글 발견하게 되었어요!! 영광 이에요!!
교수님 말씀은 어렵게만 들렸는데 선배가 쓰신 글 차분히 읽으면서 이해가 되고 있어서 선배께 감사하고요!!ㅎㅎ 회귀분석 수업 아직까지 너무 어렵고 힘들고 시험 2주 앞두고 있는데 막막한 감이 없지 않아 있는데 혹시 어떻게 공부하면 좋을지 사소한 조언이라도 좋으니 듣고 싶습니다^^ 교수님 교안, 교수님 강의, 한글 번역본 책 이라는 여러 좋은 자료들이 있는데 어떻게 활용을 해야 할지를 모르겠어요 ㅠㅠ
선배가 정리하신 것은 교수님 강의를 쉽게 풀어서
선배님 말투로 이해하신 대로 잘 정리하셨던데 실제로 어떤 방식으로 정리하셨는지도 궁금합니다!
짧게라도 좋으니 답변 남겨주시면 진짜 넘 감사할 것 같아요❤️ 바쁘실텐데 제 글 읽어주셔서 감사합니다!!

답글 달기