[제로베이스] CH4. EDA - 판다스 기초 2

정해성·2023년 7월 1일
0

제로베이스

목록 보기
22/36
post-thumbnail

판다스 기초 내용이 많아 나눠서 포스트 한다.....

판다스 기초

- 컬럼 추가

컬럼을 추가할 때 기존 컬럼이 있으면 그 컬럼이 수정되고, 기존 컬럼이 없다면 추가가 된다.

- 데이터 존재 확인

isin() 함수를 사용하면 특정 요소가 있는지 확인할 수 있다.
isin()을 마스킹에도 활용 할 수 있다. 즉, 존재하는 데이터만 다시 데이터 프레임화 가능하다.(이미지 맨 밑 예시 참고)

- 컬럼 제거

컬럼 제거 방식엔 두가지가 있다.
del

drop

- 열 연산

열에 대한 연산을 가능하게 해주는 함수로 apply()가 있다.

apply()에 np 연산도 가능하다. 이때 axis라는 개념이 등장하는데 numpy의 매트릭스의 구조를 알아야 한다.
apply함수에 np연산을 적용할 때 위의 axis 기준을 같이 정의 해주어야 한다.

- 데이터 병합

Pandas에서 데이터 프레임을 병합하는 방법은 3가지가 있다.
pd.concat()
pd.merge()
pd.join()

pd.merge()

  • 두 데이터 프레임에서 컬럼이나 인덱스를 기준으로 잡고 병합하는 방법
  • 기준이 되는 컬럼이나 인덱스를 "키"값이라 한다.
  • 기준이 되는 키 값은 두 데이터 프레임에 모두 포함 되어 있어야 함! 공통으로 가지고 있어야 한다는 뜻.

pd.merge()를 예시로 아래의 데이터를 합쳐보자.

profile
코린이 공부중

0개의 댓글

관련 채용 정보