xswer19.log
로그인
xswer19.log
로그인
box_plot
안선경
·
2023년 3월 16일
팔로우
0
0
ML_study
목록 보기
10/25
통계를 이해하는데 중요한 개념 중 하나는 4분위수다.
25%, 50%(중앙값), 75%를 기준으로 구분해서 1, 2, 3, 4분위수로 나눈 것이다.
여기서 중요한 개념은
Q
3
−
Q
1
Q3 -Q1
Q
3
−
Q
1
의 값은 IQR이라고 보고
Q
1
,
Q
3
Q1, Q3
Q
1
,
Q
3
를 기준으로 IQR를 1.5배한 값에서 더 멀어진 값은 아웃라이너로 취급한다.
이를 시각화를 통해 눈으로 확인해보자
먼저 samples변수에 임의값을 넣고 산점도를 박스 느낌으로 표현했다.
그리고 IQR과 각 분위수를 저장하고 값들을 변수에 저장했다.
점선에서 더 멀어진 값이 바로 아웃라이너이다.
안선경
상황을 바꿀 수 없다면, 나를 바꾸자
팔로우
이전 포스트
math function
다음 포스트
Regression_Basic
0개의 댓글
댓글 작성