오직 1%의 개발자만이 이 3가지 plot을 구분할 수 있습니다.

Junseong Park·2024년 8월 22일

TIL

목록 보기
2/7
post-thumbnail

들어가며

안녕하세요. 저는 부스트캠프 AI Tech 7기 과정을 진행하고 있는 박준성이라고 합니다. 오늘의 포스팅은 TIL이 아니라 어제 배운 거라서 TYL이긴 하네요. 오늘 강의 내용 외적으로 배운 게 있긴 한데 너무 깊이있게 알지 못하고 다 이해하기 힘들 것 같아서 어제 배운 내용부터 미리 털어버리겠습니다.

너무 많은 plot들

어제는 seaborn 라이브러리에서 사용할 수 있는 다양한 plot을 배웠습니다만, 무언가 미묘하게 차이가 있는 것 같으면서도 그게 무엇인지는 정확하게 모르겠더라구요. 그래서 그 차이를 좀 정확히 짚고 넘어가고, 나아가서는 스스로 적재적소에 필요한 plot을 활용할 수 있도록 구글링을 해봤습니다.

제가 헷갈린 3가지 plot은 sns.catplot, sns.displot, sns.relplot이었습니다. 썸네일의 각 plot이 어떤 plot인지 맞추실 수 있으신가요? 일단 전 실패했습니다.

sns.catplot()


catplot은 categorical value를 다루는 plot입니다. 즉, 범주형 변수에 대한 plot이죠. 보이는 것처럼 각각의 범주들이 어떤 값을 갖는지 표시하기 적합한 plot입니다.

여담으로 팀원 중 한 분이 고양이(cat)가 막 스크래치를 그어놓은 모양이 catplot이라고 외우셨다는데 저희 팀원 모두가 더 이상 catplot에 대해 까먹을 수 없게 되었습니다.

sns.displot()


displot은 분포(distribution)를 잘 보여줄 수 있는 plot입니다. 보이는 것처럼 약간 전체적인 수학 성적의 분포가 어떻게 되는지 한 눈에 파악할 수 있습니다.

sns.relplot()


relplot은 관계(relation)를 잘 보여줄 수 있는 plot입니다. 산점도가 상관관계를 확인하기에 용이한 것처럼 relplot도 보이는 것처럼 읽기 성적과 수학 성적 사이의 상관관계를 쉽게 확인할 수 있습니다.

마치며

처음 TIL를 쓸 때만 해도 매일매일 포스팅할 정도로 배우는 게 있을까 싶었는데 예상 외로 포스팅 거리가 넘쳐나서 당황했습니다. 제가 글 쓰는 속도가 못 따라갈 정도입니다. 글 쓰는 속도도 계속 쓰다 보면 늘겠죠? 앞으로도 계속됩니다. 화이팅.

profile
부스트캠프 AI Tech 7기

0개의 댓글