[TIL] #1.1.3 Data Manipulation

Bella·2021년 3월 8일
0

TIL

목록 보기
3/11

Pandas

concat

pd.concat([x, y])
  • 행을 기준으로 붙이기
pd.concat([x, y], axis = 1)
  • 열을 기준으로 붙이기

merge

df = df.merge(붙일 데이터, how = '방법', on = '기준 feature')

inner-join

  • 서로 매칭 되는 것만 붙여 조회 (교집합)
    참고
    참고

conditioning

condition = (df['feature'] > 0)
df_subset = df[condition]
  • () 로 감싸기
df_subset = df[(df['feature'] > 0)]
  • condition 변수 설정 없이 바로 사용 가능

isin

df_subset[df_subset['feature'].isin(['value'])]
  • 숫자형 값이 기준이 아닌 범주형 데이터를 기준

참고

group by

df_subset.groupby('feature').mean()
  • mean : 평균값 구하기

참고

tidy

df = df.melt(id_vars = 'feature', value_vars = ['value1', 'value2'])
  • 각 행에 대해서 unique identifier 확인
  • 한 개의 'tidy' 한 열에 대해서 포함되어야 할 (기준이 되는) 데이터 선택

한글 깨짐 해결

참고

더 알고싶은 부분

  • 쉼표가 포함 된 문자열 데이터를 쉼표를 지운 숫자형 데이터로 쉽게 바꾸는 방법
  • merge
profile
Here Today, Gone Tomorrow

0개의 댓글