box_plot

안선경·2023년 3월 16일
0

ML_study

목록 보기
10/25
post-custom-banner

  • 통계를 이해하는데 중요한 개념 중 하나는 4분위수다.
  • 25%, 50%(중앙값), 75%를 기준으로 구분해서 1, 2, 3, 4분위수로 나눈 것이다.
  • 여기서 중요한 개념은 Q3Q1Q3 -Q1의 값은 IQR이라고 보고 Q1,Q3Q1, Q3를 기준으로 IQR를 1.5배한 값에서 더 멀어진 값은 아웃라이너로 취급한다.
  • 이를 시각화를 통해 눈으로 확인해보자
  • 먼저 samples변수에 임의값을 넣고 산점도를 박스 느낌으로 표현했다.
  • 그리고 IQR과 각 분위수를 저장하고 값들을 변수에 저장했다.
  • 점선에서 더 멀어진 값이 바로 아웃라이너이다.
profile
상황을 바꿀 수 없다면, 나를 바꾸자
post-custom-banner

0개의 댓글