: 파이썬에서 시각화를 위한 라이브러리 중 하나.
import matplotlib.pyplot as plt
plt.plot(x,y) # 2차원 선 그래프 생성
plt.xlabel('X-axis') # x축 라벨링
plt.ylabel('Y-axis') # y축 라벨링
plt.title('Example') # 그래프 이름 라벨링
plt.show() # 그래프 구현
스타일 설정
범례 및 텍스트 추가
df=pd.DataFrame({
'A'=[1,2,3,4,5]
'B'=[5,4,3,2,1]
})
ax=df.plot(X='A', y='B', color='red', linestyle='--', marker='o')
ax.legend(['Data Series'])
ax.set_xlabel('')
ax.set_ylabel('')
ax.set_title('')
ax.text(x좌표, y좌표, 'text', fonsize=12)
plt.show()
plt.figure(figsize=(가로 길이,세로 길이))
plt.subplots(): Matplotlib에서 하나의 Figure와 그 안에 포함된 Axes(하위 플롯)를 생성하는 함수.
fig는 Figure 객체이고, ax는 Axes 객체. ax를 통해 그래프를 그릴 수 있음.
fig, ax:
fig, ax = plt.subplots(figsize=(8, 4)) # 8인치 x 4인치 크기
ax.plot([1, 2, 3, 4], [10, 20, 25, 30], label='Sample Line')
ax.set_title('Example Plot')
ax.set_xlabel('X-axis')
ax.set_ylabel('Y-axis')
ax.legend()
plt.show()
plt.bar(x,y)
#그 아래 라벨링은 방법 똑같음
import numpy as np # 넘파이를 실행해서 랜덤하게 1000개의 데이터를 생성해낸 것
data=np.ramdom.randn(1000)
plt.hist(data, bins=구간 분포 범위)
#그 아래 라벨링은 방법 똑같음
plt.pie(sizes=[], lables=[])
plt.title('')
plt.boxplot(x=나타내고자 하는 데이터 분류 기준 개수, y=각 기준에 포함되는 데이터 개수, data)
plt.scatter(x,y)
#그 아래 라벨링은 방법 똑같음
# string이 있는 데이터들간의 상관관계 보는 방법
data.corr(numeric_only=True) # or 스트링으로도 상관 분석 가능하게 데이터 전처리 필요.
그래프 유형 | 자료 유형 | 특징 |
---|---|---|
Line plot | 연속형 데이터 | 데이터의 변화 및 추이를 시각화 |
Bar plot | 범주형 데이터 | 카테고리 별 값의 크기를 시각적으로 비교 |
Histogram | 연속형 데이터 | 데이터 분포, 빈도, 패턴 등을 이해 |
Pie chart | 범주형 데이터의 비율 | 범주별 상대적 비율을 부채꼴 모양으로 시각화 |
Box plot | 연속형 데이터의 분포 | 중앙값, 사분위수, 최소값, 최대값, 이상치 확인 |
scatter plot | 두 변수 간의 관계 | 변수 간의 관계, 군집, 이상치 등 확인 |
라이브러리 | 설명 |
---|---|
Matplotlib | 파이썬의 기본 시각화 라이브러리. 다양한 종류의 그래프 생성이 가능하고 다양한 커스터마이징 기능을 제공. 또한 DataFrame에서 바로 시각화할 수 있는 기능 제공. DataFrame.plot을 통해서 다양한 종류의 그래프 생성 가능. |
Seaborn | Matplotlib을 기반으로 만들어진 통계 데이터 시각화를 위한 라이브러리. 히트맨, 카운트 플롯, 상자 그림, violin plot과 같은 통계적 그래프 생성에 특화. 사용하기 쉬운 API 제공. |
Plotly | 인터랙티브한 그래프 생성을 위한 라이브러리. 웹 기반의 대화형 시각화 제공. 사용자의 상호작용에 따라 데이터를 동적으로 조정할 수 있는 장점을 가지고 있음. |
특징/도구 | Tableau | Google Data Studio | Amazon QuickSight |
---|---|---|---|
사용자 인터페이스 | 직관적이과 사용자 친화적 | 사용하기 쉽고 간단한 AI | 직관적이고 쉽게 사용 |
연동 가능한 데이터 소스 | 다양한 데이터 소스와 연동 | 다양한 데이터 소스와의 연동 가능 | AWS 데이터와의 연동 가능 |
시각화 기능 | 다양한 시각화 및 차트옵션 제공 | 다양한 시각화 기능 제공 | 다양한 시각화 옵션 제공 |
대시보드 공유/협업 | 공유 및 협업 기능 지원 | 공유 및 협업 기능 제공 | 협업 및 공유 기능 기능 |
클라우드 기반 | 데스크톱 및 클라우드 기능 제공 | 구글 클라우드 기반 | AWS 클라우드 기반 |
확장성 | 확장성이 좋음 | 구글 서비스와 연동하여 확장 가능 | AWS 생태계 내에서 확장 가능 |