09/06

채언·2022년 9월 6일
0

1. 데이터셋 iris 가져오기

  • 꽃잎 이미지를 통해, 길이와 너비를 분석하고 사진에 맞는 꽃잎의 카테고리를 분류해둔 데이터셋이다.

2. pairplot 그래프

  • pairplot() 을 하면, iris 데이터셋의 모든 컬럼을 각 x,y축에 대해 표현한다. scatter 나 막대그래프 형으로 표현됨.
  • ticks 옵션을 주면 그래프에서 선을 표현하게 된다.
  • hue 옵션을 지정하면, 각 종별로 세가지 색으로 나뉘어져 표현된다.
  • x_vars 와 y_vars 를 지정하면
    가로축에 원하는값, 세로축에 원하는값만 지정해서 볼 수도 있다.

3. lmplot 그래프

  • seaborn 데이터에서, anscombe 데이터셋을 가져온다. 각 x,y값에 따라 데이터셋을 1,2,3,4로 구분지어 놓은 데이터프레임이다.

  • lmplot 을 통해 전체적인 값의 분포를 직선그래프로 표현할 수 있고, data 값을 query를 통해 조건을 지정하여 dataset 값에서 I 에만 해당하는 값을 그릴 수 있다 .
  • scatter_kws={'s':90} 옵션으로, 점의 사이즈도 조절 할 수 있다.

  • 옵션 order 값을 지정하면, 전체적인 값의 분포를 점으로 나타내고 그를 평균적으로 나타낸 직선을 좀 더 가깝게 곡선으로 표현한다.


    -robust 옶션값을 True 로 주면, 값의 전체적인 분포에서 많이 벗어난 값을 무시하고 그래프를 그린다. 그러면, 많이 벗어난 값 하나 때문에 비틀어졌던 직선이 그 값 하나를 무시하고 정확한 직선으로 표현된다.
profile
화이팅!

0개의 댓글