Pandas
concat
pd.concat([x, y])
pd.concat([x, y], axis = 1)
merge
df = df.merge(붙일 데이터, how = '방법', on = '기준 feature')
inner-join
- 서로 매칭 되는 것만 붙여 조회 (교집합)
참고
참고
conditioning
condition = (df['feature'] > 0)
df_subset = df[condition]
df_subset = df[(df['feature'] > 0)]
- condition 변수 설정 없이 바로 사용 가능
isin
df_subset[df_subset['feature'].isin(['value'])]
- 숫자형 값이 기준이 아닌 범주형 데이터를 기준
참고
group by
df_subset.groupby('feature').mean()
참고
tidy
df = df.melt(id_vars = 'feature', value_vars = ['value1', 'value2'])
- 각 행에 대해서 unique identifier 확인
- 한 개의 'tidy' 한 열에 대해서 포함되어야 할 (기준이 되는) 데이터 선택
한글 깨짐 해결
참고
더 알고싶은 부분
- 쉼표가 포함 된 문자열 데이터를 쉼표를 지운 숫자형 데이터로 쉽게 바꾸는 방법
- merge