New 2 - Data Science

Coaspe·2021년 11월 9일
0

Data Science

목록 보기
5/5

1. sns.despine()

  • 그래프에서 테두리 삭제하는 역할

2. Skewness, Kurtosis

1. Skewness

  • 왜도라는 뜻으로 분포의 비대칭성을 나타내는 척도이다.
  • 왜도가 양수이면 Data의 중심이 정규 분포보다 왼쪽으로 치우쳐져 있고, 꼬리는 오른쪽으로 길어지게 표현된다.(Right-skewed)
  • 왜도 값이 -2~2 정도의 치우침은 왜도가 크지 않다고 판단한다.

2. Kurtosis

  • 첨도라는 뜻으로 도수 곡선의 최빈치를 중심으로 하는 부분의 완만함, 뾰족함의 정도를 나타내는 수치이다.
  • 정규분포의 첨도는 0이며, 첨도가 0보다 크면 정규분포보다 더 뾰족한 모양인 고첨이 되고, 0보다 작으면 정규분포보다 낮아지는 저첨이 된다.

3. plt.subplots_adjust()

  • subplots의 layout을 바꾼다.

4. sns.distplot()

  • Distribution plot과 histplot이 섞여있다.

5. Dataframe.corr()

  • Corelation을 갖고 있는 Dataframe을 반환한다.

6. sns.heatmap()

  • Correlation에 대한 heatmap이다.

7. Skewed distribution은 np.log1p()같은 함수로 normalized 될 수 있다.


8. round(data[column].isnull().mean()*100, 2)

  • column의 null 값을 %로 구하는 방법

9.ax.xaxis.grid()

  • 위의 그래프의 빨간색 선을 의미한다. (color='r')

10. features[column] = features.groupby('Neighborhood')['column'].transform(lambda x: x.fillna(x.median()))

  • 이웃으로 grouping한 후에 중간값으로 NaN 값을 채우기

11. pandas.DataFrame.update()

  • 나머지는 유지하고 해당 column을 교체한다.

12. sns.boxplot()에서 x와 y를 명시하지 않으면 y는 data의 column이고 x는 값을 의미한다.

profile
https://github.com/Coaspe

0개의 댓글