[Python] Matplotlib 2

wooaeng·2025년 10월 31일

Python

목록 보기
6/8

산점도(산포도)

  • x축과 y축을 가지는 좌표평면 상 관측값들을 점을 찍어 표시하는 그래프
  • scatter() 이용
    • 1번 인수: x축 값, 2번 인수 : y축 값
    • x, y 모두 parameterfh 전달해야 함, 원소 개수 같아야 함
    • 색상 color=, 점 모양 maker=, 점 크기 s=, 투명도 alpha= 지정 가능

상관계수

  • 두 변수 간 상관관계를 정량적으로 계산한 값

    • -1 ~ 1 사이 값이 나옴
    • 양의 상관관계(비례 관계) : 0 ~ 1
    • 음의 상관관계(반비례 관계) : -1 ~ 0
    • 절대값이 1로 갈수록 상관관계가 강함

  • 상관계수 그래프
    DataFrame객체[[계산할 컬럼명1, 계산할 컬럼명2]].corr()

막대 그래프

  • 수량/값의 크기 비교를 위해 막대 형식으로 나타낸 그래프
  • 범주형 데이터의 class별 개수 확인 시 사용
    bar(x, height)
    • 수직 막대 그래프 메소드
    • 1번 인수 : x값, 2번 인수 : 막대 높이
      `barh(y, width)
    • 수평 막대 그래프 메소드
    • 1번 인수 : y값, 2번 인수: 막대 너비

파이 차트

  • 전체 데이터에서 각 범주(카테고리)가 차지하는 비율을 나타내는 데 사용
    pie(x, labels)
    • 1번 인수 : 값, 백분위에 맞춰 값들의 비율 계산 후 크기 설정
    • 2번 인수(labels=) : 값들의 lables
    • autopct : 조각 내 표시될 비율의 문자열 형식, %formating 사용

      💡 % formating

      구분formating
      정수%d
      실수%f
      문자열%s
      %%%
      *실수의 경우 %와 f 사이에 .n을 입력해 소수점 뒤 자리수 지정 가능 (ex. %.2f)

      🔗 참고한 hyjykelly님 포스트

히스토그램

  • 히스토그램 : 도수 분포표를 그래프로 나타낸 것
  • 도수 분포표 : 연속형 자료를 특정 구간으로 나눠 그 빈도를 나타낸 표, 빈도 확인이나 분포를 볼 때 사용
    hist(data [, bins=계급개수])

상자 그래프

  • 데이터의 4분위수를 기반으로 연속형 변수(continuous variable)의 분포를 요약하고 이상치를 시각적으로 표현하는 그래프
  • 연속형 값들의 중심, 퍼짐(분포), 이상치 확인 가능
    boxplot(x, whis=)
    • 1번 인수 : 데이터 셋
    • 2번 인수 : 극단치 계산 시 사용할 값, 기본값 1.5

0개의 댓글