판다스 기초 내용이 많아 나눠서 포스트 한다.....
판다스 기초
컬럼을 추가할 때 기존 컬럼이 있으면 그 컬럼이 수정되고, 기존 컬럼이 없다면 추가가 된다.
isin() 함수를 사용하면 특정 요소가 있는지 확인할 수 있다.
isin()을 마스킹에도 활용 할 수 있다. 즉, 존재하는 데이터만 다시 데이터 프레임화 가능하다.(이미지 맨 밑 예시 참고)
컬럼 제거 방식엔 두가지가 있다.
del
drop
열에 대한 연산을 가능하게 해주는 함수로 apply()가 있다.
apply()에 np 연산도 가능하다. 이때 axis라는 개념이 등장하는데 numpy의 매트릭스의 구조를 알아야 한다.
apply함수에 np연산을 적용할 때 위의 axis 기준을 같이 정의 해주어야 한다.
Pandas에서 데이터 프레임을 병합하는 방법은 3가지가 있다.
pd.concat()
pd.merge()
pd.join()
pd.merge()
pd.merge()를 예시로 아래의 데이터를 합쳐보자.