점을 사용해 두 feature간 관계 파악에 사용
산점도
.scatter()
사용
색, 모양, 크기
상관 관계 확인
점이 많아질수록 점의 분포를 파악하기 힘듦
색
마커
크기
인과관계와 상관관계는 다름
인과 관계 : 항상 사전 정보와 함께 가정으로 제시할 것
scatter의 패턴을 유추할 수 있는 선
추세선이 2개 이상 넘어가면 가독성이 떨어짐
ax = fig.add_subplot(111, aspect=1)
ax.scatter(x, y)
로 산점도 그림
ax.scatter(x=iris['SepalLengthCm'],
y=iris['SepalWidthCm'],
c=['royalblue' if yy <= swc_mean else 'gray' for yy in iris['SepalWidthCm']]
)
for species in iris['Species'].unique():
iris_sub = iris[iris['Species']==species] # Species 부분집합
ax.scatter(x=iris_sub['PetalLengthCm'],
y=iris_sub['PetalWidthCm'],
label=species)
ax.legend()
plt.show()
※ 모든 이미지 및 코드 출처는 네이버 커넥트재단 부스트캠프 AI Tech 5기입니다. ※