[혼공데이터분석] chapter 5.

회색몽구스·2023년 8월 8일
0

Chapter 05 데이터 시각화하기

05-1 맷플롯립 기본 요소 알아보기

Figure 객체

맷플롯립에 Figure라는 모든 그래프 구성 요소를 담고 있는 최상위 객체입니다.

그러므로, figure() 함수로 명시적으로 피겨 객체를 만들어 활용하면 다양한 그래프 옵션을 조절할 수 있습니다.

그래프 크기 바꾸기: figsize 매개변수

인치 단위의 가로 세로 크기를 튜플로 전달

# 현재 맷플롯립의 기본 그래프 크기를 확인하려면?
print(plt.rcParams['figure.figsize'])

그래프 실제 크기 확인하기

DPI (dot per inch)의 약자로 1인치를 몇 개의 점으로 표현하는지 나타내며, 맷플롯립의 기본 DPI는 72입니다.

# 현재 맷플롯립의 기본 DPI를 확인하려면?
print(plt.rcParams['figure.dpi'])

코랩 노트북의 타이트 레이아웃을 사용하지 않으려면 bbox_inches 옵션을 None으로 지정해야 합니다.

그래프 크기 바꾸기: dpi 매개변수

  • figsize는 그래프를 그리는 캔버스 크기, dpi는 그래프를 확대해서 보는 돋보기처럼 생각

rcParams 객체

rcParams는 맷플롯립 그래프의 기본값을 관리하는 객체일 뿐 아니라 새로운 값으로 바꿀 수 있으며, 변경하면 이후 그려지는 모든 그래프에 바뀐 설정이 적용

DPI 기본값 바꾸기

산점도 마커 모양 바꾸기

  • rcParams로 한 번 바꾸면 다음 그래프를 그릴 때 또 다른 모양을 전달해야 하므로, scatter() 함수에 marker 매개변수로 전달하면 scatter plot을 그릴 때마다 다른 모양을 쓸 수 있어서 더 편리

여러 개의 서브플롯 출력하기

하나의 피겨 객체 안에는 여러 개의 서브플롯을 담을 수 있습니다. 서브플롯이란 맷플롯립의 Axes class의 객체를 말하며 하나의 서브플롯은 두 개 이상의 축을 포함합니다.

각 축에는 눈금 또는 틱이 표시되고 축의 이름을 나타내는 레이블이 있습니다.

서브플롯 그리기: subplots() 함수

figsize 매개변수 - 피겨 크기를 지정

set_title() 메서드 - 각 그래프에 제목을 넣기

서브플롯을 가로로 나란히 출력하기

subplots() 함수에 행과 열을 지정

05-2 선 그래프와 막대 그래프 그리기

연도별 발행 도서 개수 구하기

value_counts() 메서드 - 데이터프레임의 한 열에서 이 메서드를 호출하면 고유한 값의 등장 횟수를 계산

판다스 시리즈 객체를 반환하는데, 인덱스의 오름차순으로 정렬하려면,

sort_index() 메서드 사용

주제별 도서 개수 구하기

선 그래프 그리기

맷플롯립의 plot() 함수로 선 그래프를 그릴 수 있습니다.

서브플롯을 사용하지 않을 때 그래프 제목은 title() 함수, x축 이름과 y축 이름은 각각 xlabel(), ylabel() 함수를 사용하여 지정합니다.

선 모양과 색상 바꾸기

linestyle 매개변수, color 매개변수, marker 매개변수를 사용

선 그래프 눈금 개수 조절 및 마커에 텍스트 표시하기

x축 눈금을 지정할 때 xticks() 함수를 사용

ref) yticks() 함수, 서브플롯을 사용할 때는 set_xticks(), set_yticks()

판다스 시리즈 객체의 items() 메서드를 사용하면 인덱스와 값을 감싼 튜플을 얻을 수 있습니다.

그래프에 값을 표시할 때 annotate() 함수를 사용

텍스트를 마커에서 조금 떼어 놓으려면 텍스트 위치를 조절하는 xytext 매개변수를 전달

xytext 매개변수와 함께 textcoords 매개변수를 전달하여 상대적인 위치를 포인트나 픽셀 단위로 지정

막대 그래프 그리기

맷플롯립에서 bar() 함수는 막대 그래프를 그립니다.

텍스트 정렬, 막대 조절 및 색상 바꾸기

텍스트 위치 조절 - annotate() 함수의 ha 매개변수에 'center'를 전달, 텍스트가 서로 겹치는 경우가 있으므로 fontsize 매개변수로 지정, 색깔도 color 매개변수를 지정

bar() 함수에 막대의 두께를 조절하는 width 매개변수, color 매개변수를 지정

가로 막대 그래프 그리기

barh() 함수 사용, width 매개변수가 아니라, height매개변수로 막대 그래프의 두께를 조정

x, y축도 바뀌고 va 매개변수로 텍스트의 위치를 지정

profile
끄아아아아 할 수 있다

0개의 댓글