Data Manipulation

kimx1201·2021년 1월 16일
0

TIC : Today I Confused

목록 보기
3/10

NaN 알아보기
Null - 아무런 값도 나타내지 않는 특수한 값
Boolean(null) 에서는 false
Number(null) 에서는
String(null) 에서는 "null"

Undefined - 선언은 되었으나 값이 할당 되지 않은 상태
Boolean(undefined) 에서는 false
Number(undefined) 에서는 NaN
String(undefined) 에서는 "undefined"

데이터 프레임에서 첫 번째 행을 헤더로 둔다.

new_header = df.iloc[0]

첫 번째 칼럼을 헤더로 둔다.

df.columns = new_header

Concat? Merge?
concat이 두 개의 데이터 프레임을 합친다면 merge는 두 데이터 프레임의 공통된 항목을 기준으로 합친다.
append → 2개의 함수를 세로로 결합할 때 사용.

df = df1.append(df2)
df = pd.concat([df1, df2])

concat은 3개 이상의 함수도 가로 세로로 결합 가능

df = pd.concat([df1,df2], axis=1) #세로로 결합할 때는 axis = 1을 넣어줘야 함.

Merge
: 두 데이터 프레임을 공통된 항목을 기준으로 합친다.

df = pd.merge(df1, df2, how='inner', on=['H']) #inner (교집합)

공통된 열(H)를 on 인자에 기입.

  1. outer (합집합)
df = pd.merge(df1, df2, how='outer', on=['H'])

공통 열에 대하여 두 데이터가 가지고 있는 모든 값을 결합한다. 공통열에 매치 되는 값이 없다면 NaN으로 채워진다.

  1. left 
df = pd.merge(df1, df2, how='left', on=['H'])

왼족 데이터 df1 에 있는 H열을 기준으로 df2가 합쳐지게 된다.

  1. right
    오른쪽 데이터 즉 df2에 있는 H열을 기준으로 df2의 데이터가 합쳐지게 된다.
df = pd.merge(df1, df2, how='right', on=['H'])
profile
Lifelong learner, dreamy data analyst, cat lover and enthusiastic runner :)

0개의 댓글