실습하다가 코드에서 궁금한 부분이 생겨서 튜터님 찾아갔더니 친절하게 설명해주시고 전체적으로 다시 설명해주셔서 금방 궁금한 부분을 해소 할 수 있었다!
이해했는데 혹시 까먹을까봐 다시 한번 필기해서 오늘 TIL에 적어본다!!
통계학 기초
피어슨 상관계수
- X와 Y의 선형의 관계를 보여주는 상관계수
출처: 블로그
⭐특징
두 연속형
변수 간의 선형 관계 측정
의 값
사용하는 경우🤔
💡비선형 관계에선
사용 불가
!
예) 학생들의 공부시간과 시험 성적의 관계
⭐특징
데이터가 정규분포를 따르지 않거나 순서형 데이터
를 가진 변수들일 때
비선형적인 관계를 나타낼 때
사용하는 경우🤔
해당 블로그에서는 같은 데이터를 사용하여 분석하였기에 그래프가 똑같이 나왔음!
BUT, 같은 데이터라도 스피어만이 더 에러나 편차에 민감하기 때문에 결과가 다르게 나올 수 있음 !!
예) 고객 만족도와 재구매의 관계
⭐특징
서로의 정보에 대한 불확실성을 줄이는 정도를 바탕으로 계산
범주형 데이터에 적용 가능
사용하는 경우🤔
예) 강아지와 고양이, 높고 낮음의 관계
머신러닝을 활용하면 훨씬 더 빠르게 구할 수 있다. 아직 머신러닝 안배워서 잘은 모르겠당
💡두 변수가 범주형(문자열,수치형으로 나타낼 수 없는) 변수를 가지거나 비선형적이고 복잡한 관계를 알고자 할 때 쓴다!
임시공휴일 정상출근 공지에 반발하는 진상(?) 학생 때문에 고통받고 계시는 튜터님과 리하 매니저님😅